1.前言
Github官方文档
https://github.com/isnowfy/snownlp
SnowNLP是一个简单易学的中文文本工具。我觉得它更像是瑞士军刀一样的文本处理工具。
可以进行中文分词、词性标注、情感分析、文本分类、拼音、繁体转简体、关键词提取、文本摘要提取、文本摘要提取、文本相似性分析、tf-idf词嵌入。
2.简单演示
首先在命令行中运行
pip install snownlp
from snownlp import SnowNLP#从snownlp这个库中调SnowNLP这个类
s = SnowNLP('博主是好人')
s.sentiments#分析情感程度,越接近1越积极
s.words#中文分词,返回一个列表
s.pinyin#查看拼音
s.tf#每一个词出现在语料库中的词频
s.idf#每一个词出现在语料库中的词频和出现在整个语料库中的词频进行了加权
s = SnowNLP('这个博主写的代码真垃圾')
s.sentiments
s.words
运行情况
对象是一段话。
text = '大学,即普通高等学校,是一种功能独特的组织。它与社会的经济和政治机构既相互关联又鼎足而立,是传承、研究、融合和创新高深学术的高等学府,不仅是人类文化发展到一定阶段的产物,还在长期办学实践的基础上,经过历史的积淀、自身的努力和外部环境的影响,逐步形成了一种独特的文化。'
s = SnowNLP(text)
s.sentiments
s.keywords(5)#方法,在函数里面传入参数,这里是查看5个关键词
s.summary(2)#找到两个关键的话、总结
s.sentences#把长文本的每一句话都单独提出来