さぽろぐ

  日記・一般  |

新規登録ログインヘルプ


2006年09月18日

ここのバックアップ。その後(Firefox+ScrapBook編)

んで、SiteSuckerで挫折したわたしが次に試したのは、Firefoxの拡張機能であるScrapBookというものである。(これも濱野さんに教えていただいた)

Firefoxなので、この方法だとMac, Win どちらでも可能であり、ベストな方法かと思ったのだが…。
これも結論からいうと、おしかったけど不完全。(^_^;

以下、やったこと。

まず、Firefoxが必要。インストールしてない人は下記からダウンロードしませう。
Mozilla Japan

んで、ScrapBookの拡張機能は下記からインストール。(インストール方法はとりあえず省略)
ScrapBook - Firefox Extension

使い方は、まず取り込むページに移動してから、ScrapBookメニューの「ページの詳細な取り込み...」を選択。(ちなみに自由領域にいろいろ貼付けてる人は、バックアップ中はとりあえず、自由領域を消しておくと余計なものがダウンロードされずによい)
んで、各種設定をするわけだが、一番肝心なのが「リンクをたどる深さ」で、まず「3」でやってみた。

ちなみに、ディレクトリ制限(指定したディレクトリから下だけにダウンロード制限)の設定はこのウィンドウになくて、「取り込む」のボタンを押した後に表示されるウィンドウ(URLリストがでてるウィンドウ)の左下にある「フィルタ」というプルダウンメニューの中にある「ディレクトリで制限(http://〜)」ってのを選択すると該当しないURLのチェックが外れるようになっている。
んで、ディレクトリ制限かけたいときは、「取り込む」ボタンを押すとダウンロード開始されてしまうので、すかさず「一時停止」ボタンをクリックし、その後フィルタを設定をしてから「開始」ボタンをクリックしてダウンロード再開するのがよろしいかと。

1時間半ぐらいで完了。んで取得データだがどこにあるかというと、Mac OS Xの場合、~/Library/Application Support/Firefox/Profiles/default.mjo/ScrapBook/data の下に保存されている。(default.mjoのとこは個人の設定によって違うかもしれん)

んで、SiteSuckerと比較して画像ファイルが大体あるように見えたわたしはそこで「やりぃ〜!完璧か?」と喜んだのだが、確認作業として、000*.htmlというファイル(北国tvのシステムでの個別記事のhtml)の数を数えてみたんだがどうも足りないんである。(^_^;
#自分のチャンネルのアーカイブの各年の合計と比較。この記事を書いてる時点では671。
実際に、ScrapBookの閲覧機能でローカルデータを見ていくと、いくつかの記事のリンクがローカルデータでなく、本物のほうへのリンクのままになっている。つまりその記事が取得できていない。
んで、htmlが足りないってことは、その記事に貼り付いてるかもしれない画像ファイルもないことも予想される。つまり不完全。

それならと、「リンクをたどる深さ」を「4」とか「5」と設定してやり直してみた。(設定方法は3の横にある>>をクリックしてでてきたウィンドウに数字を入力)
んが、どっちも3時間ほどで終わり、htmlの数もどちらも461どまり(つまり210記事足りない)なんである。(「3」の時の数は失念&データ消去したため再集計不可)
ここで、ダウンロードリストを見ていて気づいたのだが、たまたまかもしれんがリスト数がちょうど1000で終わっていた。(もしかして1000までしかリストできない仕様なのか?(^_^;)

ってことで、深さ「4」「5」で変化がないということはそれ以上やっても無駄ってことなので、このFirefox+ScrapBookによる方法も不完全ってことで終了。

つまり、現状完全なバックアップ方法というのはまだみつかっていない。
んで、ここまでやってみて考え直してみることにした。

んで、次に続く。

あなたにおススメの記事

同じカテゴリー(ソフトな話)の記事画像
仮想日本一周徒歩の旅
同じカテゴリー(ソフトな話)の記事
 記事修正のテストその2 (2010-11-02 17:30)
 なるほど簡単だ (2010-11-02 16:52)
 別な地図表示方法の模索中 (2007-02-16 00:35)
 仮想日本一周徒歩の旅 (2007-01-12 23:59)
 散歩コース距離計測 (2007-01-07 17:50)
 書き初め Flash (2007-01-02 15:59)

この記事へのコメント
お疲れ様です.

確かに私が試したときも1000で終わっていました.
もしかしたら1000個で打ち止めなのかもしれません.
Posted by hrykhmn at 2006年09月18日 19:06
やはり、1000でしたか。
ログが残らないので曖昧な記憶だったので自信がなかったのですが、深さ4でも5でも1000だったような気がしたんですよね。
やっぱり仕様なのかな。(^_^;

それとブログ復活してたんですね。全然気づいてなかった。(^_^;
早速RSS登録しときました。(でも最近更新してないのねん。)
Posted by ぞうさん at 2006年09月18日 21:51
一度復活しかけてやめたというのが正しいですね.

PC内のデータ整理してたらたまたまアカウントを見つけて・・・といった状態です.
更新する予定は今のところないです.
Posted by hrykhmn at 2006年09月18日 22:08
そうでしたか。残念です。(^_^;
Posted by ぞうさん at 2006年09月19日 23:53
はじめまして。ブックマークレットなどでこれまでさんざんお世話になっていたのに、コメントは初めてですみません。北国の1ユーザーとしてぞうさんにはこれまでお世話になり、感謝申し上げます。

私はWindows XPですが、巡回ツールではやはりうまくバックアップできず、このエントリを参考にしてFirefox+ScrapBookでバックアップが完了しました。ぞうさん、濱野さん、ありがとうございました。

ScrapBookの上限の1000にひっかかりましたが、投稿年月ごとではなく、カテゴリごとにアーカイヴするようにして、深さを指定し(ブログのエントリだけの保存でよければ「2」)、「[フィルタ]→[文字列でフィルタ]→そのカテゴリのトップページのURLを指定」として、カテゴリごとの過去ログのページの取りこぼしのないように何度かに分けてやったところ、うまく行ったと思います。ただし1エントリに画像を複数貼り付けた場合に取り込めていない画像もあるかもしれません。(画像のカテゴリが記事のカテゴリと異なる場合。)

以上、御礼かたがたご報告まで。
Posted by nofrills at 2006年09月30日 07:14
わたしの記事やブックマークレットがお役に立てたのでしたら幸いです。(^-^)
また使用方法の追加情報をありがとうございます。この記事を読まれたかたの参考になるかと思います。
Posted by ぞうさん at 2006年09月30日 14:58
※このブログではブログの持ち主が承認した後、コメントが反映される設定です。
上の画像に書かれている文字を入力して下さい
 
<ご注意>
書き込まれた内容は公開され、ブログの持ち主だけが削除できます。

削除
ここのバックアップ。その後(Firefox+ScrapBook編)
    コメント(6)