最近在客户这边配置了一把OmniFind搜索Portal 6.1、WCM以及Domino,颇费了一番功夫,不过配置好了之后还是挺好用的,在这里将其中的一些关键部分与大家分享。
配置Portal6.1搜索
- 配置OmniFind8.5搜索Portal 6.1.*时,注意要为OmniFind升级到FP3,否则无法搜索Portal6.1的版本。同时将OmniFind的WAS版本升级到6.1 FP23或以上。
- 创建SeedList爬虫类型搜索Portal 6.1,而不是自带的Portal爬虫
- 在ES_NODE_ROOT/master_config/collection_id.crawler_id 目录下 ( 例如: C:\IBM\es\esadmin\master_config\col_19473.SEEDLIST_3224 )创建 文件seedlistcrawler_ext.xml
- 内容如下:
<?xml version="1.0" encoding="UTF-8" ?> <ExtendedProperties> <AppendChild XPath="/Crawler/DataSources/Server" Name="PagingSize">100</AppendChild> <AppendChild XPath="/Crawler/DataSources/Server/Target" Name="SeedlistExtraParameter">&Source=com.ibm.lotus.search.plugins.seedlist.retriever.portal.PortalRetrieverFactory</AppendChild> </ExtendedProperties>
- 重新启动OmniFind
配置Domino搜索
这次配置在搜索Domino方面遇到了最难搞的问题,经过几天的摸索,把其中的一些关键的Tips列出来:
- 注意选择“对HTML格式使用UTF-8”选择“是”
- 创建搜索集合时“启用安全性”,“N-gram分段”选择"对不以空格为字定界符的语言启用",要使用的语言选择“简体中文”
- 建立新的爬虫,设置爬虫采用DIIOP访问Domino,同时不启用SSO
- 设置搜寻空间属性,自动检测语言---要使用的语言为简体中文