lucene
文章平均质量分 75
技术人宝哥
北漂15年互联网技术人,服务于优酷,阿里,京东的大厂,深耕技术管理、广告变现、高并发/复杂系统架构设计
展开
-
Lucene的工作原理(转载)
Lucene的工作原理(转载)Lucene的工作原理Lucene的概述: Lucene(发音为 ['lusen] )是一个非常优秀的开源的全文搜索引擎,我们可以在它的上面开发出各种全文搜索的应用来。Lucene在国外有很高的知名度,现在已经是Apache的顶级项目,在国内,Lucene的应用也越来越多。Lucene的算法原理: Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in转载 2011-05-18 10:56:00 · 769 阅读 · 0 评论 -
IKExpressionV2.0简易表达式解析器使用说明
转自:http://linliangyi2007.iteye.com/blog/337069IKExpressionV2.0简易表达式解析器使用说明目录 1. IK表达式介绍(IK Expression Introduction) 2. 快速入门(Quick Start) 3. 表达式公式规范(Expression Formula Specification)4. 高级转载 2012-02-08 19:28:58 · 1907 阅读 · 0 评论 -
lucene的多个字段搜索以及分页并高亮显示
package mutilSearch;import java.io.IOException;import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import org.apache.lucene.analysis.Analyzer;import org.apache.lucene.analysis.standard.StandardAnalyzer;import org.原创 2011-04-26 19:22:00 · 3328 阅读 · 1 评论 -
lucene应用心得以及几种中文分词器的使用比对
lucene应用心得以及几种中文分词器的使用比对:1、创建索引和关键字搜索在不同的系统中运行出现的问题如果将创建索引和关键字搜索分别写在后台和前台系统,然后分别将这两套系统部署在同一个应用服务器下面( 如同一个tomcat6.0),在会出现一下现象:,(a)当点击后台的创建索引,运行正常,这时,在点击前台的关键词搜索则就报异常 (b)点击前台的搜索(之前已经创建好索引),运行正常,这时,在原创 2011-06-16 19:47:00 · 3184 阅读 · 0 评论 -
PaodingAnalyzer使用方法以及配置步骤
PaodingAnalyzer使用方法: PaodingAnalyzer使用方法:下面进入主题,来讲解Lucene和"庖丁解牛"中文分词包的整合. "庖丁解牛"的下载地址是[url]http://code.google.com/p/paoding/downloads/list[/url],下载好后解压,我解压在E:/paoding2_0_4,进入该目录首先将paoding-a原创 2011-06-16 19:30:00 · 10986 阅读 · 1 评论 -
lucene 删除索引
<br /><br />public static void deleteDocument(HttpServletRequest request, String id){<br />String pa = request.getRealPath("").replace("fangdake", "");<br />String pathdir =pa+"fasdq"+File.separator+PrePath ;<br />Analyzer analyzer = new IKAnalyzer();<br /原创 2011-05-26 18:42:00 · 1156 阅读 · 0 评论 -
Lock obtain timed out: SimpleFSLock@E://javasource//LuceneTest//index//write.lock异常
<br />Lock obtain timed out: SimpleFSLock@E://javasource//LuceneTest//index//write.lock异常的原因:<br /> <br />1、 lucene在写入索引时, 用在索引目录下建write.lock文件来标识锁定. 而只有在执行close()方法后, 才会删除这个锁文件. 只要这个文件存在, 其他的写索引的程序都会报错: <br /> caught a class org.apache.lucene.store.LockO原创 2011-05-26 18:30:00 · 3460 阅读 · 0 评论 -
htmlparser详解
<br />本文转自 http://jackyrong.javaeye.com/blog/692456 ,供大家啊学习研究<br />htmlparser是个优秀的网页信息抓取工具,下面小结其一些基本的用法: <br /><br />1 创建parser对象,有两种方式 <br /> Parser parser=new Parser(String html) <br /> 传入的html <br /> 第2种为: <br /> //通过指定URLConnection对象创建Parser对象 <br转载 2011-03-31 16:49:00 · 2170 阅读 · 0 评论 -
HTMLParser的visitor访问方式详解
<br />参考文档:http://allenj2ee.iteye.com/blog/222457 ,希望与大家分享<br />从简单方面的理解,Filter是根据某种条件过滤取出需要的Node再进行处理。Visitor则是遍历内容树的每一个节点,对于符合条件的节点进行处理<br />。实际的结果异曲同工,两种不同的方法可以达到相同的结果:<br />1、<br />package html;<br />import java.io.IOException;<br />import java.net.Htt原创 2011-04-01 15:01:00 · 1754 阅读 · 0 评论 -
HTMLParser的filter访问方式详解
<br />参考地址:http://hi.baidu.com/neverend06/blog/item/86ab838aa60dfc6c9f2fb4fe.html<br />HTMLParser遍历了网页的内容以后,以树(森林)结构保存了结果。HTMLParser访问结果内容的方法有两种。使用Filter和使用Visitor。<br />(一)Filter类<br />顾名思义,Filter就是对于结果进行过滤,取得需要的内容。HTMLParser在org.htmlparser.filters包之内一共定义原创 2011-04-01 11:33:00 · 4528 阅读 · 0 评论 -
lucence小例子-注释详解
<br />1、创建索引<br />package demo;<br />import java.io.IOException;<br />import org.apache.lucene.analysis.Analyzer;<br />import org.apache.lucene.analysis.standard.StandardAnalyzer;<br />import org.apache.lucene.document.Document;<br />import org.apache.luce原创 2011-03-31 11:02:00 · 1161 阅读 · 0 评论 -
Lucene中创建索引的效率和删除索引的实现
<br /><br />转自:http://lionsource.blog.163.com/blog/static/8874137820106333910639/Lucene中创建索引的效率和删除索引的实现<br />越来越多的人利用开源组件 Lucene来开发自己的搜索引擎。在数据量不大的情况下,我们不会太关注创建索引的效率;但是,但数据达到一定的数量是,我们就不得不考虑如何提高创建索引的性能,以缩短索引创建的时间。<br />我们是用Lucene中提供的类IndexWriter来创建索引的,所以我们不妨转载 2011-05-18 10:19:00 · 927 阅读 · 0 评论 -
采访IK Analyzer 中文分词器开源项目作者林良益(十三)
转自:http://www.iteye.com/magazines/43-ik-analyzer 众所周知,全文搜索几乎已经成为每个网站的必须提供的基本功能之一,用Lucene构造一个“索引-查询”的应用是常见的java解决方案,目前由linliangyi2007创立的IK Analyzer是最好的Lucene 中文分词器之一。首先介绍一下IKAnalyzer:IKAnalyzer转载 2012-02-08 19:30:28 · 4026 阅读 · 0 评论