↑日記で日々積み重ねた情報をトップの「わんこのページ」にまとめています。

おのたく日記 [RDF] YouTubeも始めました→


2010-10-15(Fri) [長年日記]

[tDiary] コンテンツデータ復活

先日の日記に書いたように、tDiaryの@data_path以下の*.td2ファイルを消してしまった。

そこで、tDiaryのコンテンツデータ復活に挑戦。

とりあえず2006年7月までのデータはバックアップが有るので復活、それ以外は

まずは、「tDiary Salvage」というの見つけたので、Googleキャッシュから復旧する方法探した。

「tDiary Salvage」は

・Googleキャッシュのダウンロード(TDiarySalvage)

・ダウンロードしたHTMLファイルをtDiary形式に変換(TDiaryFilter)

・変換したコンテンツデータをtDiaryにPOST追記(TDiaryPoster)

[tDiary Salvageより引用]

というものなのだけど、

・最近のGoogleはTDiarySalvageのようなロボットで自動的にデータ取得しようとする事を禁止しているのと、残念ながらこの日記は、Googleのキャッシュとして月毎のデータは有るけど日毎のキャッシュは無い日が多い。

・POSTで投稿するより、修正時間もそれなりにしたいので@data_path以下の*.td2を復活の方がよさそう。

ということで、

1. Googleのキャッシュを月毎に取得

2. 自作コンバーターを使って、html→td2ファイルに変換してtDiaryのデータファイルを作成

3. コンバータの書き換え残しなどを手動で編集

という方法を取ることにした。

自作コンバータは、

amazonプラグイン

myプラグイン

絵日記プラグイン

bqプラグイン

に対応して、HTML形式をtDiaryのプラグインに書き換える。

これにより、日記本文については、ほぼ完全に取り戻すことが出来た。

ただし、

・タイトルは余り使ったことがないので、一番最初のパラグラフのタイトルで代用

・この日記では、日付は実際より±2週間ぐらいの誤差があり、更新日付が正しい日付だったのだけど、更新日付はGoogleキャッシュには残っていないようなので、日付を更新日付で代用(=変更日付の情報が無くなった)

・ツッコミは全文がキャッシュに残っていない場合があった。

・ツッコミとTrackBackの日付は、まだ調整中(日記の日付と文字列の表示が二つ表示)

と問題は残っている。

本日のPingbacks(全0件)

Google Web検索 on-o.com内を検索