![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
lucene
fuanyu163
这个作者很懒,什么都没留下…
展开
-
安装Paoding中文分词
安装Paoding中文分词 转自 博客http://www.cnblogs.com/tjsquall/archive/2009/06/30/1514077.html 1,把paoding-analysis-2.0.4-beta解压缩,给项目中加入paoding-analysis.jar。 2,把dic文件夹放到项目的根目录中。dic文件夹里是paodi...原创 2012-02-21 15:13:44 · 114 阅读 · 0 评论 -
Lucene3.0 初窥 总结
来自:http://liuxinglanyue.iteye.com/blog/851972 Lucene3.0 初窥 总结(收藏) lucene数据结构全文检索框架 【Lucene3.0 初窥】全文检索的基本原理 【Lucene3.0 初窥】Lucene体系结构概述 【Lucene3.0 初窥】文本分析器Analyzer 【...原创 2012-02-24 11:52:42 · 84 阅读 · 0 评论 -
转:基于lucene实现自己的推荐引擎
采用基于数据挖掘的算法来实现推荐引擎是各大电子商务网站、SNS社区最为常用的方法,推荐引擎常用Content-Based 推荐算法及协同过滤算法(Item-Based 、User-based)。但从实际应用来看,对于大部分中小型企业来说,要在电子商务系统完整采用以上算法还有很大的难度。 1、常用推荐引擎算法问题 1)、相对成熟、完整、现成的开源解决方案较少粗略分来,目前与数据挖掘及推荐引擎相关...原创 2012-02-29 15:51:15 · 56 阅读 · 0 评论 -
庖丁解牛(paoding) 如何定制自己的字典 (摘自官方配置文件)
庖丁中文分词需要一套词典,这些词典需要统一存储在某个目录下,这个目录称为词典安装目录。词典安装目录可以是文件系统的任何目录,它不依赖于应用程序的运行目录。将词典拷贝到词典安装目录的过程称为安装词典。增加、删除、修改词典目录下的词典的过程称为自定制词典。 在linux下,我们可以考虑将词典安装在一个专门存储数据的分区下某目录,以笔者为例,笔者将/data作为系统的一个独立分区,笔者便是将词典保存在/...原创 2012-03-05 17:39:35 · 122 阅读 · 0 评论 -
Apache solr3.5 安装(转)
来自:http://lucius-yu-126-com.iteye.com/blog/1330458 1.安装JDK1.6 2.安装tomcat6.0 3.下载、安装、配置solr: 1) 下载solr3.5, 官方下载地:http://apache.etoak.com//lucene/solr/3.5.0/ 选择apache-solr-3.5.0.zip 下载。 2) 安装so...原创 2012-03-08 15:41:41 · 70 阅读 · 0 评论