如图所示这是已经编译好的IK插件。
找到config ==> IKAnalyzer.cfg.xml
将.dic文件放入config文件夹之中,再填入标签之中
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">extra_single_word_full.dic</entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">extra_stopword.dic</entry>
<!--用户可以在这里配置远程扩展字典 -->
<!-- <entry key="remote_ext_dict">words_location</entry> -->
<!--用户可以在这里配置远程扩展停止词字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>
比如: extra_stopword.dic 是扩展停止词字典,就是说在进行分词的时候,”的、得、着“,等等这些没有实际意义的词会被去掉,用户也可以根据业务,自行添加自己认为没有意义的词。
extra_stopword的内容:
也
了
仍
从
以
使
则
却
又
及
对
就
并
很
或
把
是
的
着
给
而
被
让
在
还
比
等
当
与
于
但
除此以外还可以在下面配置远程词库,需要填写远程字典的地址。
最后试一下效果:
可以看到“的”字已经被去除,词典引入有效。