Lucene
lkx94
java开发工程师
展开
-
Lucene入门教程
Lucene教程转载自:http://blog.csdn.net/tianlincao/article/details/68671271 lucene简介1.1 什么是lucene Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产转载 2015-03-13 23:50:33 · 356 阅读 · 0 评论 -
lucene索引的增删改查
转载自:http://499316246-qq-com.iteye.com/blog/2036805Lucene2--索引的增删改查博客分类: lucenelucene 1.全文检索系统的结构 2.Lucene倒排索引原理 假设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzh转载 2015-03-17 09:56:52 · 621 阅读 · 0 评论 -
Lucene入门示例
主要参考了Lucene的官方示例 环境:Win7 + JDK1.6 + Eclipse37 Lucene版本:3.5 官方:http://www.apache.org/dyn/closer.cgi 检索的基本概念 一 信息检索:从信息集合中打找出与用户相关的信息. 1 信息检索的分类 全文检索:把用户的查询请求和全文中的每一个词进行比较不考虑查询请求与文本语义的匹配。转载 2015-03-13 23:24:22 · 419 阅读 · 0 评论 -
Lucene4.3入门
转载自:http://www.cnblogs.com/dyllove98/archive/2013/06/19/3144919.html 辞职交接期间无聊看了一下搜索引擎,java社区比较火的当然是Lucene,想写一个简单的小例子,在网上找了些资料,不过都不是4.3的,自己看了一下。下载地址:http://lucene.apache.org/core/项目结构转载 2015-03-13 23:59:24 · 569 阅读 · 0 评论 -
目前几个流行的Lucene中文分词器对比
转载自:http://www.iteye.com/news/96371. 基本介绍:paoding :Lucene中文分词“庖丁解牛” Paoding Analysisimdict :imdict智能词典所采用的智能中文分词程序mmseg4j : 用 Chih-Hao Tsai 的 MMSeg 算法 实现的中文分词器ik :采用了特有的“正向迭代最细粒度切分算法“,多子转载 2015-03-14 15:33:28 · 4853 阅读 · 0 评论 -
lucene3.6.1 经典案例 入门教程
转载自:http://liqita.iteye.com/blog/1676664lucene3.6.1 经典案例 入门教程博客分类: JAVA 语言lucene第一步:下载lucene的核心包lucene-core-3.6.1-javadoc.jar (3.5 MB) lucene-core-3.6.1.jar (1.5 MB)转载 2015-03-14 16:46:34 · 697 阅读 · 0 评论 -
Lucene实战之初识Lucene
转载自:http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/Lucene 简介Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工转载 2015-03-13 22:49:03 · 424 阅读 · 0 评论 -
Lucene的工作原理
Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He once lived in Shanghai. 1)由于lucene是基于关键词索引和查询的,转载 2015-03-13 23:05:55 · 403 阅读 · 0 评论 -
基于 Lucene 的8 个开源搜索引擎
转载自:http://www.lupaworld.com/article-215678-1.html 一 直接使用 Lucene ( http://lucene.apache.org ) 说明:Lucene 是一个 JAVA 搜索类库,它本身并不是一个完整的解决方案,需要额外的开发工作 优点:成熟的解决方案,有很多的成功案例。apache 顶级项目,正在持续快速的进步转载 2015-03-23 14:34:49 · 693 阅读 · 0 评论 -
关于Lucene断点续索引和增量索引的问题
转载自:http://daimajishu.iteye.com/blog/1076496关于lucene断点续索引和增量索引的问题1、 像百度、google等桌面搜索建立索引的时候可以停止后重新索引,他能保证以前索引过的文件重新索引的时候不用再索引吗?如果停止后要索引的文件进行了 删除和添加等操作,那么他是怎么处理的以保证索引文件的覆盖率。用lucene索引文件的时候如何实现这种功能,给个转载 2015-03-17 00:46:47 · 1293 阅读 · 0 评论 -
IK和Paoding分词器的区别
转载自:http://my.oschina.net/MrMichael/blog/361899?p=1目录[-]1. IK和Paoding的技术介绍一、Ik分词器介绍:优点:缺点:二、Paoding分词器介绍:优点:缺点:2. IK和Paoding的技术对比一、IK分词策略:二、Paoding分词策略:三、二者的分词区别:转载 2015-03-26 23:21:35 · 3232 阅读 · 0 评论 -
Lucene使用详解
转载自:http://blog.chinaunix.net/uid-20648927-id-1907275.html1. 引言编写目的介绍开源软件搜索引擎——lucene的各个实现的功能,性能,以及代码分析1.2. 背景分析的系统名称Lucene该开源主页http://lucene.a转载 2015-03-16 01:15:14 · 1769 阅读 · 0 评论 -
Lucene范围搜索的6种实现方式
转载自:http://blog.csdn.net/bestdowt1314/article/details/5837545范围搜索的六种实现方式 当你想用一些规则(例如时间范围)来过滤查询的时候,lucene给我们提供了许多方法实现。选择越多意味着灵活性越大,但同时也意味着做出错误选择的机会 也越大。下列代码包含了六种filter的使用方式和性能表现。并加入了选择建议。转载 2015-03-16 01:18:05 · 1029 阅读 · 0 评论 -
Lucene关系数据库的使用
转载自:http://blog.csdn.net/xsxxxsxx/article/details/8687021主要介绍如何周期性尽量实时地从RDBMS爬数据然后建索引,不涉及AOP或ORM Framework的listener方式。先决条件:Lucene索引是从无到有的,一开始所有数据都是存储在RDBMS(Oracle)中。数据表有一列是updateTime或称为las转载 2015-03-16 00:46:42 · 741 阅读 · 0 评论 -
lucene对整个数据库建立全文索引
导言:如果要对整个数据库做精确查询或模糊查询,我们怎么才可以做到?还是通过SQL查询吗?答案是否定的。因为,通过SQL对整个数据库做精确查询或模糊查询,速度将非常的慢;lucene解决了这个问题。通过对表或者文本文件预先建立索引,可以很快的实现全文检索。思路:1、通过SQL得到所有表名的集合---->2、遍历所有的表,分别为每个表的每个记录建立索引;同时添加表的中文转载 2015-03-16 01:07:55 · 1009 阅读 · 0 评论 -
OSChina是如何处理索引更新问题的
一般使用 Lucene 来做全文搜索时,都会碰到这样一个问题,什么时候创建、更新或者删除索引。假设是发帖子吧,如果一发贴就即时写入索引,好处是索引及时,但这会引起索引库被锁的问题,因为同一个时间可能很多人都在发帖,更新和删除都是同样的问题存在。还有另外一个方法是后台定时将新增的帖子写入索引库,这种可以避免索引库被锁的问题,不过刚发的帖子就没法被索引到(这个不是大问题,一般都可以接受转载 2015-03-16 01:41:53 · 519 阅读 · 0 评论 -
Lucene增量索引索引库自动更新
转载自: http://blog.csdn.net/small_madman/article/details/37693359前言:最近写了个小程序,让索引库定时自动更新,可以让你新增的数据和修改的数据都能进索引库,唯一的一个遗憾是不能将删除掉的数据剔除出去,一直在思考中。废话也不多说,上代码给瞅瞅,然后也希望有更好的解决方法的人能给我留言发表意见。1.主要的方法增量索引的转载 2015-03-16 01:31:17 · 1223 阅读 · 0 评论 -
使用Lucene为数据库建立索引
一,lucene中比较基础的建立索引步骤(资料:http://www.ourys.com/post/lucene3-0_database_index.html)1.指定目录索引2.创建Directory对象(参数是存放索引的File类型,根据File的存放地点选择创建类)3.创建indexWriter对象,参数(Directory对象,分词器,是否创建,分词的最大值)转载 2015-03-16 01:12:33 · 1251 阅读 · 0 评论 -
利用Lucene打造站内搜索引擎的思路
转载自:http://www.cnblogs.com/yjmyzz/archive/2007/12/31/1021935.html1.为什么要用Lucene,而不用直接从数据库里搜索记录?主要是考虑到几个因素:(1)性能问题,Lucene是基于文件索引的搜索机制,性能要比数据库里检索更快,特别是数据量大的时候两者区别比较明显。数据库用Select检索时,默认在执行sql语句时,会对表锁定,转载 2015-03-16 14:04:46 · 760 阅读 · 0 评论 -
一致性hash和solr千万级数据分布式搜索引擎中的应用
转载自:http://www.lanceyan.com/tech/arch/consistenthashing_and_solr.html一致性hash和solr千万级数据分布式搜索引擎中的应用Posted on 12 五月, 2013 by lanceyan| 6条评论互联网创业中大部分人都是草根创业,这个时候没有强劲的服务器,也没有钱去买很昂贵的海量数据库。在这样严峻的转载 2015-04-13 00:03:23 · 444 阅读 · 0 评论