基于lucene创建索引,查询索引的方式

需求:

内容包括两部分,一部分为唯一标示即id,一部分为内容,要实现对内容基于lucene的检索,模拟实现基于uuid作为id,内容为普通的字符串

环境:

<dependency>
	<groupId>org.safehaus.jug</groupId>
	<artifactId>jug</artifactId>
	<version>2.0.0</version>
	<classifier>lgpl</classifier>
</dependency>
<dependency>
	<groupId>org.apache.lucene</groupId>
	<artifactId>lucene-core</artifactId>
	<version>3.4.0</version>
</dependency>
<dependency>
	<groupId>IKAnalyzer</groupId>
	<artifactId>IKAnalyzer</artifactId>
	<version>IKAnalyzer2012_u6</version>
	<scope>system</scope>
	<systemPath>D:/tools/lib/IKAnalyzer2012_u6.jar</systemPath>
</dependency>

 

实现:

public class IndexService {
	private static final UUIDGenerator generator = UUIDGenerator.getInstance();
	private static final String indexDir = "D:/tools/index";
	private static final Occur[] QUERY_FLAGS = { Occur.SHOULD, Occur.SHOULD };

	public void createIndex(String content) throws Exception {
		UUID uuid = generator.generateRandomBasedUUID();

		Directory directory = new org.apache.lucene.store.SimpleFSDirectory(
				new File(indexDir));
		Analyzer analyzer = new IKAnalyzer();
		IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_34,
				analyzer);
		IndexWriter writer = new IndexWriter(directory, config);
		Document doc = new Document();
		doc.add(new Field("str", content, Field.Store.YES, Field.Index.ANALYZED));
		doc.add(new Field("id", uuid.toString(), Field.Store.YES,
				Field.Index.ANALYZED));
		writer.addDocument(doc);
		writer.optimize();
		writer.close(true);
	}

	public void queryIndex(String queryString) throws Exception {
		Analyzer analyzer = new IKAnalyzer();
		BooleanQuery bq = new BooleanQuery();
		Query q = MultiFieldQueryParser.parse(Version.LUCENE_34, queryString,
				new String[] { "str", "id" }, QUERY_FLAGS, analyzer);
		bq.add(q, BooleanClause.Occur.MUST);
		Directory directory = new org.apache.lucene.store.SimpleFSDirectory(
				new File(indexDir));
		IndexSearcher indexSearcher = new IndexSearcher(directory);
		TopDocs topDocs = indexSearcher.search(bq, 2);
		System.out.println(topDocs.totalHits);
		ScoreDoc[] hits = topDocs.scoreDocs;
		for (ScoreDoc scoreDoc : hits) {
			Document document = indexSearcher.doc(scoreDoc.doc);
			System.out.println(String.format("doc id is %s ,and score is %s:",
					document.get("id"), scoreDoc.score + ""));
		}
		indexSearcher.close();
	}

	public static void main(String[] ar) throws Exception {
		IndexService indexService = new IndexService();
		StringBuilder content = new StringBuilder();
		content.append("茶道,就是品赏茶的美感之道。茶道是一种烹茶饮茶的生活艺术,一种以茶为媒的生活礼仪,一种以茶修身的生活方式。");
		content.append("它通过沏茶、赏茶、闻茶、饮茶、增进友谊,美心修德,学习礼法,是很有益的一种和美仪式。");
		content.append("喝茶能静心、静神,有助于陶冶情操、去除杂念,符合儒道的“内省修行”思想。");
		content.append("茶道精神是茶文化的核心,是茶文化的灵魂。本账户的宗旨是传播茶叶,茶道,品茶,辨别的知识,让大家了解中华国粹。");
		// 模拟100篇文本内容
		for (int i = 0; i < 100; i++) {
			indexService.createIndex(content.toString());
		}
		indexService.queryIndex("茶叶");
	}
}

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、MATLAB、python、web、C#、EDA、proteus、RTOS等项目的源码。 【项目质量】:所有源码都经过严格测试,可以直接运行。功能在确认正常工作后才上传。 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【附加价值】:项目具有较高的学习借鉴价值,也可直接拿来修改复刻。对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。鼓励下载和使用,并欢迎大家互相学习,共同进步。【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、MATLAB、python、web、C#、EDA、proteus、RTOS等项目的源码。 【项目质量】:所有源码都经过严格测试,可以直接运行。功能在确认正常工作后才上传。 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【附加价值】:项目具有较高的学习借鉴价值,也可直接拿来修改复刻。对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。鼓励下载和使用,并欢迎大家互相学习,共同进步。【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、MATLAB、python、web、C#、EDA、proteus、RTOS等项目的源码。 【项目质量】:所有源码都经过严格测试,可以直接运行。功能在确认正常工作后才上传。 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【附加价值】:项目具有较高的学习借鉴价值,也可直接拿来修改复刻。对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。鼓励下载和使用,并欢迎大家互相学习,共同进步。【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、MATLAB、python、web、C#、EDA、proteus、RTOS等项目的源码。 【项目质量】:所有源码都经过严格测试,可以直接运行。功能在确认正常工作后才上传。 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【附加价值】:项目具有较高的学习借鉴价值,也可直接拿来修改复刻。对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。鼓励下载和使用,并欢迎大家互相学习,共同进步。【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、MATLAB、python、web、C#、EDA、proteus、RTOS等项目的源码。 【项目质量】:所有源码都经过严格测试,可以直接运行。功能在确认正常工作后才上传。 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【附加价值】:项目具有较高的学习借鉴价值,也可直接拿来修改复刻。对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。鼓励下载和使用,并欢迎大家互相学习,共同进步。【项目资源
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值