配置solr服务器:
1、创建一个文件夹core1作为新的Core
2、把solr\solrhome\configsets\basic_configs\下文件复制到core1
3、在浏览器中,选择core admin,点击add core,输入一下下内容,instanceDir一定要写为上面一步中修改后的文件夹名。
solrconfig.xml和managed-schema两个文件在solr\solrhome\core1\conf中。
Solr管理界面登录权限配置:
1、修改tomcat的tomcat-user.xml ,上面添加:
2、修改solr项目中的solr\server\webapps\solr\WEB-INF\web.xml, 在上面添加:
Solr Lockdown
/
solr
admin
BASIC
Solr
3、重新启动tomcat,再使用管理界面就必须要输入用户名/密码(admin/admin)了。
Solr的中文分词:
Solr的中文分词其实就是一个特殊的数据类型。
例如:string的数据类型中存放英文文章时,solr会自动以分词形式创建索引,而当存储中文是,则不会。这样,如果我们想要模糊查询文章中是否存在这些词语的时候,就会带来问题。它的中文分词,实际上的意义就是,在solr中增加一个数据类型,而这个数据类型恰恰能够识别并且给中文形成分词形式。
这个操作与在solr中添加字段类似,在这里我就不详细说明了,mmseg4j用Chih-Hao Tsai 的MMSeg算法实现的中文分词器,推荐一般使用的jar包有两个:mmseg4j-core-1.9.0.jar,mmseg4j-solr-2.3.0.jar。(可以在maven库中下载)