文章目录
基于python中jieba包的中文分词中详细使用(二)
01.前言
在基于python中jieba包的中文分词中详细使用(一)已经介绍了jieba分词的一些基本内容,现在接着去介绍。
02.关键词提取
02.01基于TF-IDF算法的关键词提取
import jieba.analyse
- jieba.analyse.extract_tags(sentence, topK=20, withWeight=False,
allowPOS=())
其中需要说明的是:
1.sentence 为待提取的文本
2.topK 为返回几个 TF/IDF 权重最大的关键词,默认值为 20
3.withWeight 为是否一并返回关键词权重值,默认值为 False
4.allowPO