![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
搜索
zhangt85
这个作者很懒,什么都没留下…
展开
-
lucene学习笔记1--索引创建
创建索引代码:public void createIndex(String indexPath, String dataDir) throws IOException{//获取数据源文件列表File[] files = new File(dataDir).listFiles();//创建索引目錄Directory directory = FSDirector原创 2012-10-13 16:11:27 · 536 阅读 · 0 评论 -
Elasticsearch权威指南(中文版)
http://es.xiaoleilu.com/010_Intro/10_Installing_ES.html转载 2015-08-30 13:59:01 · 2313 阅读 · 0 评论 -
solr源码下载地址
http://archive.apache.org/dist/lucene/solr原创 2015-06-15 10:04:46 · 2686 阅读 · 0 评论 -
solrCloud部署
转载http://blog.javachen.com/2014/03/10/how-to-install-solrcloud.html转载 2015-05-31 11:02:11 · 548 阅读 · 0 评论 -
lucene入门资料
转载 http://my.oschina.net/liupengjun/blog/227463#OSC_h2_71转载 2014-12-05 12:57:48 · 536 阅读 · 0 评论 -
paoding自定义词典研究2
我这篇博客的作用是为了解决用户使用paoding分词器时,添加自定义词的时候,有时候不起作用的现象的我们在使用paoding分词的时候都需要删除.compile文件夹,所以好奇的我就打开了这个文件夹,发现了名字为most-words-mode的文件夹,从名字我们可以看出这是庖丁分词的模式,即most-words模式,查看此文件夹下的vocabulary.dic.compiled的内原创 2012-10-13 17:01:35 · 2908 阅读 · 0 评论 -
lucene学习笔记2--检索
对已经创建好的索引库进行检索/*** 利用关键词对索引进行查询* * @param keyword 搜索条件* @param indexPath 索引路径* @throws IOException * @throws ParseException * @see [类、类#方法、类#成员]*/public void search(String keyword原创 2012-10-13 16:13:39 · 619 阅读 · 0 评论 -
paoding自定义词典研究1
这几天研究paoding分词器的使用,遇到一个很棘手的问题在使用庖丁自定义词典的时候,按照网上查的资料,1.首先自定义一个XXX.dic的文件,以utf-8保存;2.将自定义词添加到dic\locale下的XXX.dic中;3.删除.compile文件夹用如下代码测试分词效果: String keyword = “中国科技大学”;原创 2012-10-13 16:35:35 · 2598 阅读 · 0 评论 -
paoding(庖丁)分词器配置安装
1.首先从网上下载庖丁分词器的包:http://code.google.com/p/paoding/downloads/list2.解压到本地磁盘,例如我的存放路径:C:\lucene\paoding3.创建环境变量PAODING_DIC_HOME,值为:C:\lucene\paoding\dic,即庖丁包的解压路径,到dic文件经过上述3步,我们已经配置好了庖丁分词器,只需要在工程项原创 2012-10-13 16:22:00 · 3367 阅读 · 0 评论 -
【搜索系列】检索模型
1.向量空间模型2.布尔模型3.概率检索模型原创 2016-01-30 13:16:12 · 773 阅读 · 0 评论