[Mac] wget でサイトを丸ごとダウンロードする
ウェブサイトを保存する際、単一ページならば Google Chrome の SingleFileZ という拡張機能を使っている。単一ファイルとして保存できるので扱いやすいからだ。
SingleFileZ – Chrome Web Store
https://chrome.google.com/webstore/detail/singlefilez/offkdfbbigofcgdokjemgjpdockaafjg
しかし、複数の階層があるサイトを保存するにはどうすればいいか。そこで、wget コマンドを使ったダウンロードに挑戦してみた。
環境:macOS Catalina Version 10.15.6
(1)Homebrew をインストールしておく。
(2)以下のコマンドで wget をインストールする。
$ brew install wget
これで以下のコマンドで単一ページをダウンロードできる。
$ wget [URL]
保存ディレクトリーをしていするなら -P オプションを使う。デスクトップに保存するなら以下。
$ wget -P /Users/[ユーザー名]/Desktop/ [URL]
階層のあるサイトを保存するなら、-r オプションで再帰的に保存でき、-k オプションで絶対リンクを相対リンクに変換する。旧 Google Sites のようなページでは html を付与しないと、ダウンロードしたサイトでうまくリンクをたどれないので、-E オプションを付けて html を付与するようにする。
参考:
Mac – wgetコマンドをインストール(使えるようにする) – 開発メモ – Webkaru
https://webkaru.net/dev/mac-wget-command-install/
wgetでの保存先ディレクトリを指定する · tatsushid.github.io
https://tatsushid.github.io/blog/2014/08/specify-wget-savedir/
wget で認証付きサイトをダウンロードする – WebOS Goodies
http://webos-goodies.jp/archives/51277893.html
[wget] ファイルのダウンロード – A First Course in Linux
https://sites.google.com/site/afcinbash/home/tips/-wget-fairunodaunrodo
google siteを一括保存する (wget編) – ひゃまだのブログ
https://sites.google.com/site/hymd3a/google-site/wget