lucence hello world

/*
* lucence version 3.0.3
* 全文检索
*
* 倒排索引:单词指向文档。以关键词和分词为单位,先读取文档内容,拆分关键词,关键词定位。
* 因为词语的数量是有限的,所以索引量不会随着文本内容的增长也线性增长。
*
* 引入lucence jar包
*/
public static void main(String[] args) throws Exception {
//A创建索引
//简单例子,创建索引保存在内存中
Directory dir = new RAMDirectory();
//分词器使用lucence标准的,参数Version指定使用的lucence版本
Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30);
/*
* IndexWriter 创建和维护索引
* param1
* param2 指定创建索引使用的分词器
* param3 是否覆盖已有索引
* param4 最大Field长度
*
*/
IndexWriter writer = new IndexWriter(
dir,analyzer,true,IndexWriter.MaxFieldLength.UNLIMITED);
//添加索引
String[] docs ={
"hello java",
"search aha java",
"friday hello"
};
/*
* Document是Field的容器,被搜索的单元,搜索结果是已doc的形式返回
* 每个Field拥有Key,Value
*/
for(int i = 0;i<docs.length;i++){
Document d = new Document();
d.add(new Field("name" //key
,docs[i]//value
,Store.YES//是否存储在索引中
,Index.ANALYZED//该Field是否被索引
));
writer.addDocument(d);//将doc交给writer处理
}
writer.close();


//B 搜索
//创建搜索对象
//参数是索引目录,指定为上面创建的索引
Searcher searcher = new IndexSearcher(dir);
QueryParser parser = new QueryParser(
Version.LUCENE_30 //指定版本
,"name" //默认搜索的Feild(key)
,analyzer//搜索用的分词器,和上面创建索引使用一样的
);
Query query = parser.parse("hello"/*需要解析搜索的关键词*/);
//搜索,取结果的前5条
ScoreDoc[] tds = searcher.search(query,5).scoreDocs;
System.out.println(tds.length);//符合结果doc数
for(int i=0;i<tds.length;i++){
Document doc = searcher.doc(tds[i].doc);
//打印doc中key是name的Field的value
System.out.println(doc.get("name"));
}
/*输出结果
* 2
hello java
friday hello
*/
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值