lucene使用IKAnalyzer3.2.8中文分词器进行索引的一个小例子

最新推荐文章于 2019-08-22 00:31:00 发布

yyunix

最新推荐文章于 2019-08-22 00:31:00 发布

阅读量1.9k

点赞数

分类专栏： lucene 文章标签： lucene string query exception class 工作

本文链接：https://blog.csdn.net/yyunix/article/details/6942109

版权

lucene 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

使用IKAnalyzer3.2.8中文分词器进行索引，并进行搜索的一个小例子。

例子需导入IKAnalyzer3.2.8.jar包以及lucene相关的包，例子中我用的lucene包为lucene-core-3.4.0.jar。

package com.ik;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.RAMDirectory;
import org.apache.lucene.util.Version;
import org.wltea.analyzer.lucene.IKAnalyzer;
import org.wltea.analyzer.lucene.IKQueryParser;
import org.wltea.analyzer.lucene.IKSimilarity;

public class IkLucene {

	public static void main(String []args) throws Exception {
		Directory directory = new RAMDirectory();
		Analyzer analyzer = new IKAnalyzer();
		IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_34, analyzer);
		IndexWriter indexWriter = new IndexWriter(directory, iwc);
		
		String str = "你好沈阳，这里是辽宁！欢迎光临！";
		Document doc = new Document();
		doc.add(new Field("contents",str,Field.Store.YES,Field.Index.ANALYZED));
		indexWriter.addDocument(doc);
		
		str = "我是作者，在沈阳工作！现在还是一个普通的职员";
		doc = new Document();
		doc.add(new Field("contents",str,Field.Store.YES,Field.Index.ANALYZED));
		indexWriter.addDocument(doc);
		indexWriter.close();
		
		IndexSearcher searcher = new IndexSearcher(directory);
		searcher.setSimilarity(new IKSimilarity());
		String keyWords = "沈阳";
		Query query = IKQueryParser.parse("contents",keyWords);
		TopDocs topDocs = searcher.search(query, Integer.MAX_VALUE);
		
		System.out.println(topDocs.totalHits);
	}
}

yyunix

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
lucene使用IKAnalyzer3.2.8中文分词器进行索引的一个小例子

使用IKAnalyzer3.2.8中文分词器进行索引，并进行搜索的一个小例子。例子需导入IKAnalyzer3.2.8.jar包以及lucene相关的包，例子中我用的lucene包为lucene-core-3.4.0.jar。package com.ik;import org.apache.lucene.analysis.Analyzer;import org.apache.lu
复制链接

扫一扫