[Mac] wget でサイトを丸ごとダウンロードする

ウェブサイトを保存する際、単一ページならば Google Chrome の SingleFileZ という拡張機能を使っている。単一ファイルとして保存できるので扱いやすいからだ。

SingleFileZ – Chrome Web Store
https://chrome.google.com/webstore/detail/singlefilez/offkdfbbigofcgdokjemgjpdockaafjg

しかし、複数の階層があるサイトを保存するにはどうすればいいか。そこで、wget コマンドを使ったダウンロードに挑戦してみた。

環境:macOS Catalina Version 10.15.6

(1)Homebrew をインストールしておく。

(2)以下のコマンドで wget をインストールする。

$ brew install wget

これで以下のコマンドで単一ページをダウンロードできる。

$ wget [URL]

保存ディレクトリーをしていするなら -P オプションを使う。デスクトップに保存するなら以下。

$ wget -P /Users/[ユーザー名]/Desktop/ [URL]

階層のあるサイトを保存するなら、-r オプションで再帰的に保存でき、-k オプションで絶対リンクを相対リンクに変換する。旧 Google Sites のようなページでは html を付与しないと、ダウンロードしたサイトでうまくリンクをたどれないので、-E オプションを付けて html を付与するようにする。

参考:
Mac – wgetコマンドをインストール(使えるようにする) – 開発メモ – Webkaru
https://webkaru.net/dev/mac-wget-command-install/

wgetでの保存先ディレクトリを指定する · tatsushid.github.io
https://tatsushid.github.io/blog/2014/08/specify-wget-savedir/

wget で認証付きサイトをダウンロードする – WebOS Goodies
http://webos-goodies.jp/archives/51277893.html

[wget] ファイルのダウンロード – A First Course in Linux
https://sites.google.com/site/afcinbash/home/tips/-wget-fairunodaunrodo

google siteを一括保存する (wget編) – ひゃまだのブログ
https://sites.google.com/site/hymd3a/google-site/wget