ある時、どうしてもサイト全部を丸ごと保存しておこうと思ったのですが、静的ページで構成されたサイトは可能でもwordpressで作られたサイトを保存できるアプリがありませんでした。
wordpressで構築されたサイトはバックアップとしてプラグインを使うものを紹介したものばかり。
ですが今回やりたいのは、
「外部サイトのwordpressをそのまま保存する」です。
自サイトでない場合も含まれますので、アプリを使用する場合には悪用せず、個人用として使うなど十分注意してください。
サイトを丸ごと保存できるアプリHTTrack
サイトを丸ごと外部からログインすることなく保存できるアプリが「HTTrack」です。
wordpressは静的なWebページではなく、サーバ内部のデータベースと連携して記事を動的に生成しています。
そのため1ページずつを保存しようとするというのは、通常はできません。
ですが、データベースごと外部からコピーすることも不可能です。
HTTrackですが、配布元サイトの説明を見る限り、どういう種類のものを保存できるかという明記はありませんでした。
そのため、wordpressには使えないのではと懸念していたのですが。
使えないか使えるかはわからないから、試しに使ってみようとやってみました!!
その結果ですが…
なんとwordpressで制作されたサイトも保存できました!
ただし、wordpressを動作させるデータベースなどはコピーされず、静的なページとして保存できました。
画像データなども含まれますので、自サイトでない場合には個人使用のみにしてください。
HTTrackの使い方
ここからはHTTrackのインストールから使用方法までをまとめます。
HTTrackを配布しているサイトに行きます。
windows10の場合について説明します。
まずは解凍後に起動した画面です。
ここでは特に何もせずに、「次へ」ボタンを押します。
次にプロジェクト名と保存先を指定します。
プロジェクト名は好きな名前を付けてください。
保存先は、自分でどこに保存するか先にフォルダを作っておくといいです。
プロジェクト名と保存先を入力したら次へボタンを押します。
この画面では、保存したいサイトの情報を入力します。
アクションの指定は特に触らずに、「ウェブサイトの自動ダウンロード」を選択しておきます。
その次にサイトのアドレスを指定するのに、「URLの追加」ボタンを押します。
ダイアログボックスが表示されるので、URLの欄にダウンロードしたいサイドのアドレスを入力します。
ダウンロード開始可能にするために、「OK」ボタンを押します。
同じ画面に戻りますが、そのまま「次へ」ボタンを押します。
下の画面が表示されたら、リストボックスを選択するとすでに接続済みの場合には、「プロバイダと接続しない(すでに接続)」と出るので、これを選択します。
「完了」ボタンを押して、サイトのダウンロードを開始します。
サイトのダウンロードが開始されます。
サイトのダウンロードが終了すると、以下の画面になります。
保存先に指定したフォルダにプロジェクト名のフォルダがありますので、その中にあるindex.htmlを開くと、サイトのトップページが表示されます。
サイトに張り付けられている画像はすべてローカルファイルとして保存され、ネット上で同じサイトを見ているのと同じように見ることができます。
HTTrackでダウンロードするときの注意点
画面上に必要な情報を入力するだけで、サイトをそのままローカル環境に静的なファイルとして保存することができますが、一部問題があります。
こちらは環境や通信状況によるかもしれませんが、ダウンロード中にいくつもエラーが出る場合があります。
エラーが出た場合は、終了時の画面にエラーログを見るから内容を確認できます。
場合によっては一部サイトがダウンロードできていない可能性もありますので、注意してください。
また、通信環境の状態によってデータが正しく送信されていないこともあります。
ダウンロードしたサイトを確認してみたら、文字が化けている、画面が真っ白、index.htmlができてなかったなどの不具合が見られることがありました。
その場合は、再度同じ操作をしてやり直すと、ダウンロードできます。
もしもサイトの中身に不具合がある場合には、やり直してみてください。
コメント