Python Jieba库介绍可参考
【收藏】Python jieba中文分词库介绍
Python Jieba库中使用jieba.analyse.extract_tags来进行TF-IDF基于 TF-IDF 算法的关键词抽取。同时可以通过jieba.analyse.TFIDF
来设置IDF 频率文件。见如下示例
import jieba
# sentence 为待提取的文本
# topK 为返回几个 TF/IDF 权重最大的关键词,默认值为 20
# withWeight 为是否一并返回关键词权重值,默认值为 False
# allowPOS 仅包括指定词性的词,默认值为空,即不筛选
jieba.analyse.extract_tags(sentence, topK&#