おのたく日記 YouTubeも始めました→
2010-10-15(Fri) [長年日記]
■ [tDiary] コンテンツデータ復活
先日の日記に書いたように、tDiaryの@data_path以下の*.td2ファイルを消してしまった。
そこで、tDiaryのコンテンツデータ復活に挑戦。
とりあえず2006年7月までのデータはバックアップが有るので復活、それ以外は
まずは、「tDiary Salvage」というの見つけたので、Googleキャッシュから復旧する方法探した。
「tDiary Salvage」は
・Googleキャッシュのダウンロード(TDiarySalvage)
・ダウンロードしたHTMLファイルをtDiary形式に変換(TDiaryFilter)
・変換したコンテンツデータをtDiaryにPOST追記(TDiaryPoster)
[tDiary Salvageより引用]
というものなのだけど、
・最近のGoogleはTDiarySalvageのようなロボットで自動的にデータ取得しようとする事を禁止しているのと、残念ながらこの日記は、Googleのキャッシュとして月毎のデータは有るけど日毎のキャッシュは無い日が多い。
・POSTで投稿するより、修正時間もそれなりにしたいので@data_path以下の*.td2を復活の方がよさそう。
ということで、
1. Googleのキャッシュを月毎に取得
2. 自作コンバーターを使って、html→td2ファイルに変換してtDiaryのデータファイルを作成
3. コンバータの書き換え残しなどを手動で編集
という方法を取ることにした。
自作コンバータは、
に対応して、HTML形式をtDiaryのプラグインに書き換える。
これにより、日記本文については、ほぼ完全に取り戻すことが出来た。
ただし、
・タイトルは余り使ったことがないので、一番最初のパラグラフのタイトルで代用
・この日記では、日付は実際より±2週間ぐらいの誤差があり、更新日付が正しい日付だったのだけど、更新日付はGoogleキャッシュには残っていないようなので、日付を更新日付で代用(=変更日付の情報が無くなった)
・ツッコミは全文がキャッシュに残っていない場合があった。
・ツッコミとTrackBackの日付は、まだ調整中(日記の日付と文字列の表示が二つ表示)
と問題は残っている。
|