动态扩展IK分词器

本文介绍了如何动态删除IK分词器的全部词语。只需在src目录下创建org.wltea.analyzer.dic文件夹,放入名为main2012.dic的空文件,文件名需对应IK分词器的dic文件。此外,quantifer.dic文件存储量词信息。
摘要由CSDN通过智能技术生成

动态扩展IK分词器


IK分词器可以扩展词典,但是网上搜到的结果大多是在某个包下放一个文件,文件中存放各种各样的词语,也就是静态的扩展,一旦项目启动就无法在进行扩展。有时候静态的扩展无法满足工作需要,通过查看源码可以发现有一个名为Dictionary的类,这个类是一个单例模式,其中包含了动态添加和删除词典的功能。以下是工具类代码:

package com.lsp.util;

import java.util.ArrayList;
import java.util.List;

import org.wltea.analyzer.cfg.Configuration;
import org.wltea.analyzer.cfg.DefaultConfig;
import org.wltea.analyzer.dic.Dictionary;

/**
	操作IK分词器的词典
	建议:已经使用Lucene做过存储后就不要再添加或者删除词典中的词了,会出现找不到以前的数据的情况
*/
public
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值