Solr加入中文分词器
solrconfig.xml这个配置文件可以在你下载solr包的安装解压目录的例如: /opt/solr/example/solr/collection1/conf
首先在solrconfig.xml中加一句一下内容。这样我们自己加入的分词器才会引到的solr中.
<lib dir="../../../contrib/analysis-extras/lib" regex=".*\.jar" /> |
. IK 分词器的安装
首选要去下载IKAnalyzer的发行包.下载地址: http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip.
下载后解压出来文件中的三个复制到/opt/solr/contrib/analysis-extras/lib目录中.
IKAnalyzer2012FF_u1.jar 分词器jar包
IKAnalyzer.cfg.xml 分词器配置文件,可以自己添加字典
Stopword.dic 分词器停词字典
<fieldType name="analyzer_ik" class="solr.TextField"> <analyzer type="index" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType> |
<field name ="name_ik" type ="analyzer_ik" indexed ="true" stored ="false" multiValued ="true"/> |
到http://localhost:8080/solr地址进行测试一下刚加入的中文分词器.在首页的Core Selector中选择你配置的core后点击下面的Analysis,在AnalyseFieldname / FieldType里选择你刚才设置的字段名称或是分词器类型,在Field Value(index)中输入:上海人在海上,点击右面的分词就行了.