lucene
fuyangchang
这个作者很懒,什么都没留下…
展开
-
Analysis包分析
Analysis包分析 算法和数据结构分析: 由于Analysis包比较简单,不详述了! 算法:基于机械分词 1-gram,2-gram,HMM(如果使用ICTCLAS接口的话) 数据结构:部分源码用到了Set ,HashTable,HashMap 认真理解TokenLucene中的Analysis包专门用于完成对于索引文件的分词.Lucene中的Token是一个转载 2007-06-21 16:41:00 · 1132 阅读 · 0 评论 -
Lucene IN ACTION 中文版
http://book.csdn.net/bookfiles/276/index.html#c1csdn中的 Lucene IN ACTION 中文版网址,可以看到前四章转载 2007-05-30 13:47:00 · 1102 阅读 · 0 评论 -
利用Lucene搜索Java源代码
某些网站允许软件开发社团通过发布开发者指南、白皮书、FAQs【常见问题解答】和源代码以实现信息的共享。随着信息量的增长,和几个开发者贡献出自己的 知识库,于是网站提供搜索引擎来搜索站点上现有的所有信息。虽然这些搜索引擎对文本文件的搜索可以做的很好,但对开发者搜索源代码做了比较严格的限制。搜 索引擎认为源代码就是纯文本文件,因此,在这一点上,与成熟的可以处理大量源文件的工具――grep相比没有什么转载 2007-05-30 16:47:00 · 1773 阅读 · 0 评论 -
JAVA读取WORD,EXCEL,POWERPOINT,PDF文件的方法
JAVA读取WORD,EXCEL,POWERPOINT,PDF文件的方法http://blog.sina.com.cn/u/54c1567b010008vhOFFICE文档使用POI控件,PDF可以使用PDFBOX0.7.3控件,完全支持中文,用XPDF也行,不过感觉PDFBOX比较好,而且作者也在更新。水平有限,万望各位指正 WORD:import org.apache.lucene.d转载 2007-06-11 14:12:00 · 11253 阅读 · 5 评论 -
Compass学习文档
Compass学习文档(1)作者:javafishCompass是第一个实现java搜索引擎的开源框架,它是基于 Lucene之上的,提供更简单的搜索引擎API,事务支持,对象到搜索引擎映射(Annotations & XML),Xml到搜索引擎映射,可以和Hibernate,Spring集成,功能非常的强大。如果用Hibernate,Spring做的项目需要搜 索引擎的话,Compass是个非常转载 2007-06-15 13:49:00 · 1086 阅读 · 0 评论 -
nutch0.9 NT批处理文件
nutch0.9 NT批处理文件@echo offrem *********************************************************************rem * A script to launch nutch on Windows 2000/XP System.rem *rem * Written by babaturem * baba...2007-06-28 14:34:00 · 103 阅读 · 0 评论