lucene
文章平均质量分 86
liugang51096557
这个作者很懒,什么都没留下…
展开
-
lucene 很有用的说明,虽然有点老了``够用了
原文链接,感谢原作者http://www.ehelper.com.cn/blog/post/27.htmlhttp://www.360doc.com/content/08/0905/10/61497_1611714.shtmlpackage phz; import org.apache.lucene.analysis.standard.StandardAnalyze转载 2013-01-05 15:06:55 · 1173 阅读 · 0 评论 -
Lucene 4 和 Solr 4 学习笔记(3)
保留学习http://blog.csdn.net/fancyerii/article/details/7256379当初说要写写lucene和solr的学习笔记,写了两个后就懒得写了。最近想做个lucene和solr的中文学习网站,翻译一些lucene和solr的英文资料,并提供一个中文的交流学习平台。所以想把这个系列继续下去。 言归正传,上面说到我们的目转载 2013-01-17 16:24:09 · 1243 阅读 · 0 评论 -
IKAnanlyzer4Pinyin
修改了IKAnanlyzer的部分代码,使IKAnanlyzer支持了分词后再把词转换成拼音或者首字母来做索引,IKAznzylzer的作者博客,先感谢他的贡献。汉字转拼音用到了github上的 jpinyin 开源库,感谢作者。现在只需要IKAnanlyzer4Pinyin,你就可以实现中文分词,分词后全拼和首字母的索引。主要用在搜索建议,通讯录搜索等需要首字母和全拼搜索的地方。原创 2013-07-10 15:40:58 · 2144 阅读 · 0 评论 -
自己写Lucene分词器示例篇——写一个简单点额分析器
介绍lucene的一个简单分析器实现,基于4.x。原创 2013-08-04 12:25:23 · 2699 阅读 · 1 评论 -
lucene 4.x中如何只存储不做索引
在3.x的版本中可以用new Field("id",map.get("ID").toString(),Store.YES,Index.NOT_ANALYZED)来让lucene做索引,只存储。在4.x中,要只做存储不做索引,原创 2013-08-05 17:30:23 · 3077 阅读 · 2 评论 -
一个爬电商数据并实现搜索的例子
这是一个抓取电商商品信息,并提供搜索接口的例子。商品抓取用id遍历,Jsoup解析网页;搜索用lucene搜索支持全文索引和搜索建议原创 2013-10-13 14:49:58 · 3662 阅读 · 1 评论 -
自己写Lucene分词器原理篇——ChineseAnalyzer简单讲解
以ChineseAnalyzer为例,简单讲讲lucene分析器,也就是analyzer的分析过程原创 2013-08-04 01:53:35 · 6316 阅读 · 2 评论 -
自己写Lucene分词器原理篇——CJKAnalyzer简单讲解
其中CJK中日韩统一表意文字(CJK Unified Ideographs),目的是要把分别来自中文、日文、韩文、越文中,本质、意义相同、形状一样或稍异的表意文字(主要为汉字,但也有仿汉字如日本国字、韩国独有汉字、越南的喃字)于ISO 10646及Unicode标准内赋予相同编码。CJK 是中文(Chinese)、日文(Japanese)、韩文(Korean)三国文字的缩写。顾名思义,原创 2013-10-14 01:43:00 · 4141 阅读 · 4 评论