安装Solr
我这里下载的版本是5.5的,官方给的启动方式:/solr-5.3.1:$ bin/solr start -e cloud -noprompt
这里 -e cloud 是官方给的示例,如果不想用官方的示例,自己创建可以用如下方式solr-5.5.0 bin/solr start -noprompt
//然后自己创建一个collection solr-5.5.0 bin/solr create -c recruiting
新建的collection的存放位置:solr-5.5.0/server/solr/recruiting/
添加中文分词
将下载的jar包,移动到WEB-INF/lib下solr-5.5.0 mv ~/Downloads/mmseg4j-* ./server/solr-webapp/webapp/WEB-INF/lib
修改新建的collection下的conf下的schema.xml文件,这时你发现并没有这个配置文件,但是你会发现有个managed-schema文件,打开一看里面有如下内容:This is the Solr schema file. This file should be named “schema.xml” and should be in the conf directory under the solr home(i.e. ./solr/conf/schema.xml by default)
所以将managed-schema文件重命名为schema.xml,修改配置文件,添加中文分词。solr-5.5.0 vim server/solr/recruiting/conf/schema.xml
添加如下配置:
mode="complex" dicPath="dic"/>
mode="simple" dicPath="dic" />
上面添加了三个filedType,他们组要的区别为:mmseg4j_simple 使用Simple分词方法
mmseg4j_complex Complex 加了四个规则过虑
mmseg4j_maxword 默认。在complex基础上实现了最多分词(max-word)。“很好听” -> "很好|好听"; “中华人民共和国” -> "中华|华人|共和|国"; “中国人民银行” -> "中国|人民|银行"。
成功运行后如下:
从MySQL数据库中导入数据
在schema.xml中添加field,默认有一个id字段,然后再添加你数据库中的字段。
indexed="true" stored="true" required="true" multiValued="true" />
stored="true" required="true" multiValued="true" />
stored="true" required="true" multiValued="true" />name: 数据源字段名,搜索时使用到。
type: 搜索的类型名,例如我们配置的mmseg4j,这个对应filedType中的name。不需要分词的字符串类型,写上string即可。
indexed:是否被索引,只有设置为true的字段才能进行搜索排序分片(earchable, sortable, facetable)。
stored:是否存储内容,如果不需要存储字段值,尽量设置为false以提高效率。
multiValued:是否为多值类型,SOLR允许配置多个数据源字段存储到一个搜索字段中。多个值必须为true,否则有可能抛出异常。
题外话copyField节点 如果我们的搜索需要搜索多个字段该怎么办呢?这时候,我们就可以使用copyField。 xml 我们将所有的中文分词字段全部拷贝至all中,当我们进行全文检索是,只用搜索all字段就OK了。 注意,这里的目标字段必须支持多值,最好不要存储,因为他只是做搜索。indexed为true,stored为false。
修改solrconfig.xml文件,位置solr-5.5.0/server/solr/recruiting/conf/solrconfig.xml。 添加如下配置
class="org.apache.solr.handler.dataimport.DataImportHandler">
data-config.xml
在solr-5.5.0/server/solr/recruiting/conf/ 下创建data-config.xml 文件,配置如下:
driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://localhost/recruiting"
user="root" password="root"/>
query="SELECT id,title,major,content FROM recruiting.requireds">
将solr-dataimporthandler和mysql-connector两个jar包拷贝到solr-5.5.0/server/solr-webapp/webapp/WEB-INF/lib当中。solr-5.5.0 cp dist/solr-dataimporthandler-5.5.0.jar server/solr-webapp/webapp/WEB-INF/lib solr-5.5.0 mv ~/Downloads/mysql-connector-java-5.1.38.jar ./server/solr-webapp/webapp/WEB-INF/lib
重启服务bin/solr restart,选择当前core为recruiting,然后点击dataimport,如果配置正确,就会出现如下图,点击Execute就可以了