Fess で WordPress を検索する

全文検索システムの Fess で note を検索できるようにしたと書いた。

Fess で note を検索にする – with a Christian Wife
https://wacw.cf/2020/07/03/indexing-note-with-fess/

次は WordPress を検索してみる。

やりたいことは、「投稿」および「固定ページ」のみを検索対象とすることだ。

Fess の設定をしていく。

「Admin ページ>MENU>Crawler>Web」で新規に Web Crawling を作成し、以下のように設定する。

・Name
WordPress(適当に設定)

・URLs
https://example.com

・Included URLs For Crawling
https://example.com/.*

・Excluded URLs For Crawling
https://example.com/feed/
https://example.com/wp-json/.*
https://example.com/wp-includes/.*
https://example.com/wp-content/.*
https://example.com/category/.*(category ページをインデックスさせないためには、Excluded URLs For Indexing に書くべきのような気がするが、そちらに書くとなぜかインデックスされる。ここに書くと解決した。)
https://example.com/page/.*(これも同様。)
https://example.com/tag/.*(これも同様。)
.*xmlrpc.php.*
https://example.com(com の後ろにスラッシュを入れないようにする。)

・Included URLs For Indexing
https://example.com/.*

・Excluded URLs For Indexing
(空白;デフォルト値)

・Config Parameters
(空白;デフォルト値)

・Depth
(空白;投稿数が多いなら空白にしておく。)

・Max Access Count
(空白;投稿数が多いなら空白にしておく。)

・User Agent
Mozilla/5.0 (compatible; Fess/13.7; +http://fess.codelibs.org/bot.html)(デフォルト値)

・The number of Thread
1 (デフォルト値)

・Interval time
10000ms (デフォルト値)

・Boost
1.0 (デフォルト値)

・Permissions
(デフォルト値)

・Virtual Hosts
(空白;デフォルト値)

・Status
Enabled

・Description
(空白;デフォルト値)

* * *

以上の設定でだいたいうまく検索できるはずだ。

参考:
CMONOS.JP | 開発者ブログ | 全文検索サーバー Fess を試す
https://cmonos.jp/blog/2013062000/1.shtml

ウェブサイトのクロールに関する設定
https://fess.codelibs.org/ja/6.0/admin/webCrawlingConfig-guide.html

ウェブクロール
https://fess.codelibs.org/ja/13.6/admin/webconfig-guide.html