1、下载solr4.10链接:http://yun.baidu.com/share/link?shareid=859433875&uk=2887486548
2、修改 “core”索引的目录中的D:\solr\home\collection1\conf\solrconfig.xml
| 将<dataDir>${solr.data.dir:}</dataDir> |
修改为:
| <dataDir>${solr.data.dir:D:/solr/home/collection1/data}</dataDir> |
4、在 tomcat的solr的WEB-INF下创建文件 classes文件夹,
复制:solr-4.10.0\example\resources\log4j.properties 到:d:\solr\server\WEB-INF\classes文件夹中
5、关于schema.xml的配置说明
(1)如果需要添加mmseg4j对solr的中文分词支持,添加:
<!--配置mmsg4j-->
<fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
</analyzer>
</fieldtype>
<fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" />
</analyzer>
</fieldtype>
<fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="n:/custom/path/to/my_dic" />
</analyzer>
</fieldtype>
(2)添加自己的查询字段:
<field name="my_title" type="string" indexed="true" stored="true"/>
<field name="my_content" type="string" indexed="true" stored="true"/>
其中,name:表示要添加的查询字段
type:字段的类型,以及在schema.xml中有定义
indexed:是否索引
stored:是否存储
(3)如果需要同时在title和content中进行查询,可以添加如下字段:
<field name="title_content" type="textComplex" indexed="true" stored="false" multiValued="true"/>
<copyField source="my_title" dest="title_content"/>
<copyField source="my_content" dest="title_content"/>
其中:title_content为新定义的查询字段,如果需要同时在title和content中进行查询,那么就使用这个查询字段。
solr 有一个字段复制机制,可以提交多个不同类型字段集中到一个字段。字段复制主要涉及两个概念,source和destination,一个是要复制的字段,另一个是要复制到哪个字段
(4)设置默认查询字段,这样的话就不需要在Query中进行查询时使用my_title:hello这样的格式
将solrconfig.xml中得 <str name="df">text</str>
修改为: <str name="df">title_content</str>
这样,如果需要查询内容在标题字段或内容字段出现的结果的时候,只需要在查询条件中填写hello就可以了