lucene
文章平均质量分 80
frjcy
这个作者很懒,什么都没留下…
展开
-
lucene入门-使用JE中文分词
基于词库的算法分词,是较好的中文分词器package busetoken;import java.io.IOException;import jeasy.analysis.MMAnalyzer;public class UseJe { /** * @param args * @throws IOException */ public static void main(Str转载 2010-02-03 16:21:00 · 503 阅读 · 0 评论 -
Lucene高亮显示详解
在Lucene的org.apache.lucene.search.highlight包中提供了关于高亮显示检索关键字的工具。使用百度、 Google搜索的时候,检索结果显示的时候,在摘要中实现与关键字相同的词条进行高亮显示,百度和Google指定红色高亮显示。有了Lucene提供的高亮显示的工具,可以很方便地实现高亮显示的功能。高亮显示,就是根据用户输入的检索关键字,检索找到该关键字对应的转载 2010-02-07 17:59:00 · 1244 阅读 · 0 评论 -
lucene中文分词器--词典全切分算法
IKAnalyzer基于lucene2.0版本API开发,实现了以词典分词为基础的正反向全切分算法,是Lucene Analyzer接口的实现,代码使用例子如下:import org.mira.lucene.analysis.IK_CAnalyzer <------- 引用类import .....public class IKAnalyzerTest extends TestCase转载 2010-02-10 07:58:00 · 1294 阅读 · 0 评论 -
Lucene教程
public void SearchSort1() throws IOException, ParseException{ IndexSearcher indexSearcher = new IndexSearcher("C://indexStore"); QueryParser queryParser = new QueryParser("sort",ne转载 2010-02-07 12:12:00 · 1079 阅读 · 2 评论 -
ICTCLAS分词系统Java调用接口在Eclipse中的安装
实验环境:JDK1.5、Eclipse3.1、XP操作系统分词系统Java接口解压包:d:/fenci(http://www.nlp.org.cn中查找下载)导入步骤:在Eclipse中新建Java项目,名称为:WordSpli,目录结构如下所示: 右击WordSplit项目,选择“导入”,将弹出导入窗口,选择列表中的“文件系统”,弹出“文件系统”导入窗口,选择相关文件(如下图所示):转载 2010-02-08 12:40:00 · 649 阅读 · 0 评论 -
发一个Lucene 2.4.0对搜索结果高亮显示的代码
使用高亮显示时,需要单独引入lucene-highlighter-2.4.0.jar。这个jar包在目录 lucene-2.4.0/contrib/highlighter中,把它复制到项目的bin文件夹,并在Java Build Path中添加其引用。可以参考下面几个网页:http://www.javaeye.com/wiki/topic/73588http://hi.baidu.com/转载 2010-02-07 17:49:00 · 591 阅读 · 0 评论 -
让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)
我利用了吕震宇根据Free版ICTCLAS改编而成.net平台下的ICTCLAS,把ICTCLAS的分词为lucene所用。以下是我写的程序,比较简单。大家看看评评,有什么要改进的地方,望大家指出Analyzer类:using System; using System.Collections.Generic; using System.Text; using Lucene.N转载 2010-02-07 20:00:00 · 1608 阅读 · 0 评论 -
Lucene于搜索引擎技术(Analysis包详解)
Lucene与搜索引擎技术 TjuAILab windshow 2005.11.11 Analysis包分析 算法和数据结构分析: 由于Analysis包比较简单,不详述了! 算法:基于机械分词 1-gram,2-gram,HMM(如果使用ICTCLAS接口的话) 数据结构:部分源码用到了Set ,HashTable,HashMa转载 2010-02-07 20:06:00 · 702 阅读 · 0 评论