Lucene 总结(1)-小试牛刀

前言

   由于接触的工作对文本语义分析较多,但是实际的应用场景,如果用solr和es感觉就是杀鸡用牛刀,

所以学习lucene,部署运维都方便,可以学习,美滋滋。时间点:2017.8.22 最新版本 6.6.0

pom.xml 如下
        
        <dependency>
			<groupId>org.apache.lucene</groupId>
			<artifactId>lucene-core</artifactId>
			<version>6.6.0</version>
		</dependency>

		<dependency>
			<groupId>org.apache.lucene</groupId>
			<artifactId>lucene-queryparser</artifactId>
			<version>6.6.0</version>
		</dependency>

		<dependency>
			<groupId>org.apache.lucene</groupId>
			<artifactId>lucene-analyzers-common</artifactId>
			<version>6.6.0</version>
		</dependency>
建立索引

Directory  索引存储目录

看下具体的几种实现

 125732_UaDa_2401742.png

后面再详细介绍,这里大致知道有这么多实现即可。

Analyzer 分词器,同样有多种实现 ,比如:例子中的标准分词,IK中文分词,CJK二分分词等;

后面具体再介绍

创建索引demo:

         // 指定索引库的地址
         Directory dir= NIOFSDirectory.open(FileSystems.getDefault()
                .getPath("E:/lucene_test"));
         // 创建分词器,标准分词器
         Analyzer analyzer = new StandardAnalyzer();
         IndexWriterConfig iwc = new IndexWriterConfig(analyzer);
         IndexWriter writer = new IndexWriter(dir, iwc);
         writer.deleteAll(); // 清除以前的index
         Document document = new Document();
         Field id = new TextField("id", "1"),
                    Field.Store.YES);
         Field name = new TextField("name", "我是中国人", Field.Store.YES);
         // 将field域设置到Document对象中
         document.add(id);
         document.add(name);
         writer.addDocument(document)
         // 关闭writer
         writer.close();    
通过索引查询

简单查询demo:

            // 注意与创建索引使用相同的分词器    
            Analyzer analyzer = new StandardAnalyzer();
            // 第一个参数:默认搜索的域的名称
            QueryParser parser = new QueryParser("name", analyzer);
            Query query = parser.parse("中国");
            Directory directory = NIOFSDirectory.open(FileSystems.getDefault()
                    .getPath("E:/lucene_test"));
            IndexReader reader = DirectoryReader.open(directory);
            IndexSearcher searcher = new IndexSearcher(reader);
            // 通过searcher来搜索索引库
            // 第二个参数:指定需要显示的顶部记录的N条
            TopDocs topDocs = searcher.search(query, 10);

            // 根据查询条件匹配出的记录总数
            int count = topDocs.totalHits;
            System.out.println("匹配出的记录总数:" + count);
            // 根据查询条件匹配出的记录
            ScoreDoc[] scoreDocs = topDocs.scoreDocs;

            for (ScoreDoc scoreDoc : scoreDocs) {
                // 获取文档的ID
                int docId = scoreDoc.doc;
                // 通过ID获取文档
                Document doc = searcher.doc(docId);
                System.out.println("id:" + doc.get("id"));
                System.out.println("name:" + doc.get("name"));

            }
            // 关闭资源
            reader.close();

 

转载于:https://my.oschina.net/chuibilong/blog/1514283

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值