java开发过程中有时候会遇到在几百万甚至上千万条数据记录中检索,或者是对服务器硬盘上某个文件夹进行检索。这个时候需要用到lucene了。
lucene的开发需要用到以下几个包
lucene-core-2.0.0.jar 核心包
lucene-analyzers-2.2.0.jar 分析包
lucene-highlighter-2.3.1.jar
paoding-analysis.jar 这个包是中科院提供的汉语分词包,关于搜索引擎的分词这里不再赘述。
此外如果用到第三方的,比如lucene-regex-3.0.0.jar(正则表达式包)等等
硬盘搜索比较简单,这里不再赘述,这里只说一下数据库搜索引擎处理: