java ikanalyzer 动态扩展分词

若要使 自定义分词全部生效,请使用 细粒度分词

 

package com.thinkgem.jeesite.common.utils;

import java.io.StringReader;
import java.util.ArrayList;
import java.util.HashSet;
import java.util.List;
import java.util.Set;

import org.apache.lucene.analysis.Analyzer;
import org.wltea.analyzer.cfg.Configuration;
import org.wltea.analyzer.cfg.DefaultConfig;
import org.wltea.analyzer.core.IKSegmenter;
import org.wltea.analyzer.core.Lexeme;
import org.wltea.analyzer.dic.Dictionary;

public class LuceneHelper {
	static Analyzer analyzer = new IKAnalyzer5x(true);
	
	static Dictionary dictionary = null;
	
	
	public static void init(){
		Configuration cfg = DefaultConfig.getInstance();  //加载词库
		cfg.setUseSmart(false); //true 用智能分词 ,false细粒度可以根根据可扩展词切词
		Dictionary.initial(cfg);
		dictionary = Dictionary.getSingleton();
}
	
	/**
	 * 添加自定义词
	 * @param words
	 */
	public static void addCustomWords(Set<String>words){
			dictionary.addWords(words);  
			
		}
	/**
	 * 删除自定义词
	 * @param words
	 */
	public static void disableCustomWords(Set<String>words){
		dictionary.disableWords(words);  
		
	}
	public static List<String> queryWords(String query) {
    List<String> list = new ArrayList<String>();
    try {
    StringReader input = new StringReader(query.trim());
    IKSegmenter ikSeg = new IKSegmenter(input, false);// true 用智能分词 ,false细粒度可以根根据可扩展词切词
    for (Lexeme lexeme = ikSeg.next(); lexeme != null; lexeme = ikSeg.next()){
        list.add(lexeme.getLexemeText());
    	}
	} catch (Exception e) {
		e.printStackTrace();
	}
    return list;
}

	public static void main(String[] args) {
		init();
		System.out.println(queryWords("养老证"));
		Set<String> words = new HashSet<String>();
    words.add("养老证");
    //words.add("老保");
    addCustomWords(words);
    disableCustomWords(words);
		System.out.println(queryWords("养老证"));
		
	}

}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

life1024

你的鼓励将是我创作的最大动力。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值