搜索引擎
songjinbin
这个作者很懒,什么都没留下…
展开
-
改写IKAnalyzer分词器
ik4solr4.3solr4.3的ik分词器([https://github.com/lgnlgn/ik4solr4.3] 主要改动不是我完成的,只是指点。使用maven)支持从solr自己的环境中获取自定义词典(使用solr的ResourceLoader, 只需要把字典文件放到conf目录里)增加一个定时更新的停用词、同义词工厂类==========转载 2013-09-03 17:17:55 · 1430 阅读 · 0 评论 -
正向最大匹配中文分词算法
中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。 在这里我想介绍一下中文分词的一个最基础算法:最大匹配算法 (Maximum Matching,以下简称MM算法) 。MM算法有两种:一种正向转载 2013-09-20 22:28:30 · 1774 阅读 · 0 评论 -
solr 搜索时加空格没有结果
使用SOLR搜索时候常会出现以下问题,比如搜索“茶油” 可以搜索到结果,但是 茶和油之间加个空格就没有结果了首先你要了解产生这个原因的原理。schema.xmlnamesolrconfig.xml name="/select" class="solr.SearchHandler"> name="defaults"> name="echoP原创 2013-09-26 17:31:49 · 6100 阅读 · 0 评论 -
试着写 搜索算法-- 最大逆向匹配分词算法
最近想试着自己实现一些搜索算法,受到http://www.52nlp.cn/maximum-matching-method-of-chinese-word-segmentation这位大湿的一点启发,准备用JAVA把算法实现了一遍,代码写的有些简单,请各位大神指正, 正向最大匹配法算法思想如下所示:(注:以上最大匹配算法图来自于詹老师讲义) 逆向匹配法思想与正向一样,只是原创 2013-11-09 21:38:56 · 1128 阅读 · 0 评论 -
solr 报错信息解决
一、报错“Error opening new searcher. exceeded limit of maxWarmingSearchers=2” 以前服务器还运行着好好的,随着索引的增多,服务器经常曝出此错误,查了些资料,最后把solrConfig 中的maxWarmingSearchers>2maxWarmingSearchers>配置加大,此问题解决,查看了各种解释:由于该原创 2013-12-06 10:56:34 · 3202 阅读 · 0 评论 -
solr FieldAnalysisRequestHandler 取得solr的分词方法
FieldAnalysisRequestHandler可以对某个字段或字段类型的分词器对查询串取到分词数据。 先看 solr 的默认配置, --> -->原创 2013-12-13 14:52:29 · 2528 阅读 · 0 评论 -
solr config 部分注解
solr config 部分注解<!-- Licensed to the Apache Software Foundation (ASF) under one or more contributor license agreements. See the NOTICE file distributed with this work for additional information原创 2013-12-03 10:51:00 · 2335 阅读 · 0 评论