公司内部有不少文档站点了,wiki,api,bbs... 使用了比较成熟的软件一般都会有站内搜索功能,但有些站点就没那么幸运,比如 maven 生成的 site 站点,都是静态页面,按照树型目录导航进入目标页面,既费力又费时,如果加入站内搜索功能就幸福很多。
如果用搜索擎来写个站内搜索,实现基本的功能,估计也不是太大问题,但感觉不太专业,维护和更新都是巨大的问题,任何一个软件,想要做得成熟,必须有持续改进的过程,必须有成本付出。
还好,很容易搜索到一个较好的项目,regain。可以轻松胜任这项工作。项目地址:http://sourceforge.net/projects/regain/files/,exe 安装包。
(1)使用默认安装很简单,执行即可;
(2)默认访问地址 http://localhost:8020/
(3)先设置需要搜索的网址 http://localhost:8020/config.jsp
(4)保存设置后自动开始搜索爬虫,完成后便可开始搜索了。
Regain 默认部署为独立的搜索站点,高级用户当然想无缝集成在自己的站点中,如何实现?
(1)仍然独立部署,可以将搜索条加入到静态页面的导航条中;
(2)部署在文档站点内部。
问题
(1)搜索结果中,hit_sortContent 乱码