solr
文章平均质量分 71
allthesametome
这个作者很懒,什么都没留下…
展开
-
solr安装配置拼音分词器
1.准备jar包将ik的jar包、pinyin4j-2.5.0.jar、solr-4.9.0\contrib\analysis-extras\lucene-libs\lucene-analyzers-smartcn-4.9.0.jar拷贝到%TOMCAT_HOME%\webapps\solr\WEB-INF\lib下2.修改schema.xml原创 2015-07-14 20:40:11 · 3319 阅读 · 1 评论 -
solr同步mysql数据库
solr同步mysql数据库原创 2015-07-14 18:58:39 · 3276 阅读 · 0 评论 -
Schema.xml详解
引自:http://iamyida.iteye.com/blog/2213354schema.xml是用来定义索引数据中的域的,包括域名称,域类型,域是否索引,是否分词,是否存储,是否标准化即Norms,是否存储项向量等等。 schema.xml配置文件的根元素就是schema,有个name属性,name属性值可以随便配,根元素没什么好说的,schema元素下主转载 2015-07-14 20:44:00 · 2720 阅读 · 0 评论 -
solr中Zookeeper指令
1.upconfigjava -classpath %TOMCAT_HOME%\webapps\solr\WEB-INF\lib/* org.apache.solr.cloud.ZkCLI -cmd upconfig -zkhost 127.0.0.1:2181,127.0.0.1:2182,127.0.0.1:2183 -confdir F:\solr_home1\collection1原创 2015-07-14 20:47:13 · 1326 阅读 · 0 评论 -
solr安装mmseg4j 分词器
1.下载资料 https://github.com/chenlb/mmseg4j-solr 注意版本:mmseg4j-solr-2.0.0.jar 要求 lucene/solr >= 4.3.0。在 lucene/solr [4.3.0, 4.7.1] 测试过兼容可用。mmseg4j-solr-2.1.0.jar 要求 lucene/solr 4.8.xmmseg4原创 2015-07-15 15:16:56 · 1508 阅读 · 0 评论 -
solr安装ansj_seg分词
1.下载nlp_lang,下载地址:http://maven.ansj.org/org/nlpcn/nlp-lang/0.3/,得到jar包nlp-lang-0.3.jar2.下载ansj-seg,http://maven.ansj.org/org/ansj/ansj_seg/也可以下载源码自己编译,源码下载地址:https://github.com/NLPchina/ansj_s原创 2015-07-16 11:15:12 · 3733 阅读 · 1 评论 -
solr分词只能全词匹配怪现象
现象:例如ik分词,安装配置后,可以正常分词,如下图所示Index和Query都没问题了,十分高兴吧!随后,创建collection,导入数据,再尝试搜索。如下图所示,我们搜索“第四次会议”,可以看到有3条记录,还有点小兴奋!既然已经分词了,应该可以搜索非完全匹配的,如下图所示:fuck!Why 搜索“第五次会议”一条匹配的没有?关键搜索条件也进行了分词!郁闷的原创 2015-07-22 17:05:44 · 10108 阅读 · 2 评论 -
solr suggest配置
1.修改solrconfig.xml,添加如下内容 string <!--Optional, it is required when more than one spellchecker is configured. Select non-default name with spellcheck.d原创 2015-07-23 16:53:40 · 640 阅读 · 0 评论 -
solr中ik分词自定义词库和停止词
1、在solr的web中:\WEB-INF目录下新增一个文件夹:classes 2、新增一个文件:IKAnalyzer.cfg.xml IK Analyzer 扩展配置 my.dic; stopword.dic; 3、新增my.dic文件。文件格式必需是:无BOM的UTF-8格式,示例内容为:么么哒转载 2015-07-23 17:13:00 · 5764 阅读 · 4 评论