1. 背景
现在有两个含有索引的文件夹,位置分别是:E:\out E:\baidutieba;用luke查看索引,发现在E:\baidutieba的索引中的host域里包括以下内容
;
在E:\out的host域中,包含内容。
2. 测试步骤
2.1. 修改nutch-site.xml,修改内容如下:
<value>/out</value>
<value>/baidutieba/topic</value>
2.1.1在nutch自带的查询页面查找ifeng没有内容,去掉后一个value后,则有内容。
2.2. <value>/out ; /baidutieba/topic </value>
2.2.1启动tomcat时报错,去掉;以及后面的路径则不报错
2.3. <value>/out, /baidutieba/topic </value>
2.3.1查询时出现空指针异常,去掉,以及后面的路径不报错
3. 初步结论
Nutch不能配置两个索引路径。
4. 后续观察
4.1.了解NutchBean或Configuration是如何加载search.dir这个元素的值的,以此来做更深入的理解。