一.引入jar包:
二.在src目录下配置IKAnalyzer.cfg.xml
有需要可以自己扩展词汇与停止词
三.根据分词统计词频:
1.传入参数进行分词,并统计每个词的频率。代码如下:
2.按词频高低排序,代码如下:
3.整理简单工具类,代码如下:
其中IKSegmenter是分词的主要类,构造函数ture代表只能分词,改成false则为最细粒度分词
一.引入jar包:
二.在src目录下配置IKAnalyzer.cfg.xml
有需要可以自己扩展词汇与停止词
三.根据分词统计词频:
1.传入参数进行分词,并统计每个词的频率。代码如下:
2.按词频高低排序,代码如下:
3.整理简单工具类,代码如下:
其中IKSegmenter是分词的主要类,构造函数ture代表只能分词,改成false则为最细粒度分词