这是《Python数据挖掘课程》系列文章,前面很多文章都讲解了分类、聚类算法,而这篇文章主要讲解如何调用SnowNLP库实现情感分析,处理的对象是豆瓣《肖申克救赎》的评论文本。文章比较基础,希望对你有所帮助,提供些思路,也是自己教学的内容。如果文章中存在错误或不足之处,还请海涵。同时,推荐大家阅读我以前的文章了解其他知识。
该系列文章代码&数据集下载地址:https://github.com/eastmountyxz/Python-for-Data-Mining
希望读者能帮Github点个赞,一起加油。
目录:
一.豆瓣评论数据抓取
1.审查网页元素,获取目标网站DOM树结构
2.Selenium抓取《肖申克救赎》评论信息
3.抓取前10页评论并存储至CSV文件
二.情感分析预处理及词云显示
三.SnowNLP情感分析
1.SnowNLP
2.中文分词
3.常见功能
4.情感分析