Lucene 同义词搜索

最新推荐文章于 2022-09-24 14:45:00 发布

IT游罠

最新推荐文章于 2022-09-24 14:45:00 发布

阅读量2.2k

点赞数

分类专栏： Lucene 文章标签： lucene Java 搜索

本文链接：https://blog.csdn.net/liketing/article/details/24674295

版权

本文介绍了如何在Lucene中使用自定义TokenFilter实现同义词搜索，通过Java编程增强搜索引擎的准确性和覆盖率。

摘要由CSDN通过智能技术生成

1、自定义TokenFilter过滤器

package com.lkt.analyzer;

import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
import java.util.Stack;

import org.apache.lucene.analysis.TokenFilter;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.apache.lucene.analysis.tokenattributes.PositionIncrementAttribute;
import org.apache.lucene.util.AttributeSource;
/**
 * 定義同義詞過濾器
 * @author lkt
 *
 */
public class MyMmsegFilter extends TokenFilter {
	//用來存儲同義詞集合
	private Map<String, String[]> sameMap=new HashMap<String, String[]>();
	
	//用來存儲當前詞的同義詞
	private Stack<String> sameStack;
	
	private int flag;
	//存儲當前狀態
	private AttributeSource.State currState;
	private CharTermAttribute cta;
	private PositionIncrementAttribute pia;
	protected MyMmsegFilter(TokenStream input) {