在我之前的文章里面关于文本分析的内容也有很多,主要是讲解从头实践文本分析的流程,但是实际生活中有一些已经做得很完善的库可以很方便地直接去使用还是值得学习实践以下的。
今天主要就是使用snowNLP做一下网友们评论数据的情感分析。
数据内容样例如下所示:
因内容限制无法上传
基于snowNLP的分析代码很简洁,如下所示:
def analysis(texts):
for comm in texts:
text=dataClean(comm)
socre = SnowNLP(text)
if socre.sentiments > 0.6:
with open('good.txt', mode='a', encoding='utf-8') as g:
g.writelines(comm +"\n")
elif socre.sentiments < 0.4:
with open('bad.txt', mode='a', encoding='utf-8') as f:
f.writelines(comm + "\n")
else:
pass
接下来我们分别看下good.txt和bad.txt的数据内容样例。
good.txt内容样例如下所示:
因内容限制无法上传
bad.txt内容样例如下所示:
因内容限制无法上传
为了更加直观地看出来大家对于该话题的情感倾向性,这里对其得分进行了可视化展示,如下所示:
从结果来看,两极分化还是比较明显的。