Fess で WordPress を検索する
全文検索システムの Fess で note を検索できるようにしたと書いた。
Fess で note を検索にする – with a Christian Wife
https://wacw.cf/2020/07/03/indexing-note-with-fess/
次は WordPress を検索してみる。
やりたいことは、「投稿」および「固定ページ」のみを検索対象とすることだ。
Fess の設定をしていく。
「Admin ページ>MENU>Crawler>Web」で新規に Web Crawling を作成し、以下のように設定する。
・Name
WordPress(適当に設定)
・URLs
https://example.com
・Included URLs For Crawling
https://example.com/.*
・Excluded URLs For Crawling
https://example.com/feed/
https://example.com/wp-json/.*
https://example.com/wp-includes/.*
https://example.com/wp-content/.*
https://example.com/category/.*
(category ページをインデックスさせないためには、Excluded URLs For Indexing に書くべきのような気がするが、そちらに書くとなぜかインデックスされる。ここに書くと解決した。)
https://example.com/page/.*
(これも同様。)
https://example.com/tag/.*
(これも同様。)
.*xmlrpc.php.*
https://example.com
(com の後ろにスラッシュを入れないようにする。)
・Included URLs For Indexing
https://example.com/.*
・Excluded URLs For Indexing
(空白;デフォルト値)
・Config Parameters
(空白;デフォルト値)
・Depth
(空白;投稿数が多いなら空白にしておく。)
・Max Access Count
(空白;投稿数が多いなら空白にしておく。)
・User Agent
Mozilla/5.0 (compatible; Fess/13.7; +http://fess.codelibs.org/bot.html)(デフォルト値)
・The number of Thread
1 (デフォルト値)
・Interval time
10000ms (デフォルト値)
・Boost
1.0 (デフォルト値)
・Permissions
(デフォルト値)
・Virtual Hosts
(空白;デフォルト値)
・Status
Enabled
・Description
(空白;デフォルト値)
* * *
以上の設定でだいたいうまく検索できるはずだ。
参考:
CMONOS.JP | 開発者ブログ | 全文検索サーバー Fess を試す
https://cmonos.jp/blog/2013062000/1.shtml
ウェブサイトのクロールに関する設定
https://fess.codelibs.org/ja/6.0/admin/webCrawlingConfig-guide.html
ウェブクロール
https://fess.codelibs.org/ja/13.6/admin/webconfig-guide.html