用 Python分析胡歌的《猎场》到底值不值得看?

原创 2017年11月22日 00:00:00

專 欄

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

作者:布道,互联网运维负责人。负责公司和电商平台运维技术工作,带领团队在公司推行DevOps,践行“自动化、平台化、可视化”运维理念。目前主要关注几个方面:1.平台开发,作出更好用的工具平台提供开发同学使用,赋能开发提高提高效率;2.专家服务,例如:架构,Docker,私有云,CI/CD,容灾,性能,容量,安全等等;3.新技术,关注互联网新技术,不断更新和迭代运维技术。

11月6日,湖南卫视已经开播被称作年度压轴的大戏“猎场”,迅速占领各大榜单,成为一部高热度的电视剧。但是在豆瓣上却形成了两极分化。截止11月8日,该剧在豆瓣上的评分为5.7分。相比较胡歌之前《琅琊榜》的9.1,《伪装者》的8.3等来说,这一评分确实不高。有趣的是,首页的评分比例与“短评”“剧评”的比例存在非常大的差异!

0?wx_fmt=jpeg

首页总评分评分两级分化严重,“差评”占主 在目前11463个评价中两级分化严重,“1星”占比最高为28.6%,其次为“5星”的25.4%。“好评”(5星、4星)占比为35.80%,“一般”(3星)为16.50%,“差评”(2星、1星)占比为47.80%。很明显,“差评”占了接近一半的比例。

0?wx_fmt=jpeg

《猎场》豆瓣评分占比分布 在短评和剧评中的另一种景象 首页的豆瓣评分中“差评”占比很高,但是在豆瓣的短评和剧评中却是另一番景象。 在目前5979条短评中,“好评”占比71%,“一般”为5%,“差评”占比24%。而在392条剧评中,“5星”占了非常高的比例!84.7%的剧评给了“好评”。

0?wx_fmt=jpeg

《猎场》剧评评分分布 我们将三个位置的评分放在一起比较就会出现非常明显的差异。根据这个差异,我们可以大致判断:写出短评或者剧评的观众大部分给予了“好评”,但仍有大量观众直接给了差评,并没有说明任何原因。当然,我们并没有考虑那些不写评论,而只是点“有用”和“没用”观众。

0?wx_fmt=jpeg

才刚刚上映,剧情还在慢慢的铺,所以现在给整部剧下定论还太早。

《猎场》到底好不好看?我们还是想通过以11月8日为界,看看人们短评人的情绪,是积极,还是消极。利用词云看看大家都说了什么,希望能大家就是否建议观看给出建议。

一、爬取《猎场》热门短评 
豆瓣的反爬虫做的比较好,不登录爬虫很快就会被屏蔽掉,登录后获取cookies 如下:

0?wx_fmt=jpeg

同时建议在循环抓取的时候进行sleep,例如:

time.sleep(1 + float(random.randint(1, 100)) / 20)

《猎场》热门短评内容和时间爬取了22440条评论,代码如下:

0?wx_fmt=png

0?wx_fmt=png

二、对数据进行清洗

0?wx_fmt=png

样本数量:

0?wx_fmt=png

0?wx_fmt=jpeg

0?wx_fmt=png

三、情感分析和词云

对热门短评基于原有SnowNLP进行积极和消极情感分类,读取每段评论并依次进行情感值分析,最后会计算出来一个0-1之间的值。

0?wx_fmt=jpeg

当值大于0.5时代表句子的情感极性偏向积极,当分值小于0.5时,情感极性偏向消极,当然越偏向两边,情绪越偏激。

2017-11-06 – 2017-11-08 分析:

0?wx_fmt=jpeg

从上图情感分析来看,影评者还是还是非常积极的,对《猎场》的期望很高。

0?wx_fmt=jpeg

从词云上来看:

2017-11-09 – 2017-11-17分析

0?wx_fmt=jpeg

从上图情感分析来看,积极的情绪已经远远超过消极的情绪,还是受到大家的好评。

0?wx_fmt=jpeg

从词云上来看,出现好看、剧情、期待、喜欢等词。

四、总结

词云的背景是胡歌,大家看出来了嘛?目前豆瓣的分数已经是6.2分,目前剧情过半,相信接下来会更精彩,个人认为分数会在7.5分以上。

0?wx_fmt=jpeg

抛开豆瓣的推荐分数,通过的热门短评的情感和词云分析,是一部不错的现实剧,剧情犀利、深刻、启迪,很多人期待。如果您有时间,不妨看一下,或许能收获一些意想不到的东西。


640?wx_fmt=jpeg

长按扫描关注Python中文社区,

获取更多技术干货!

    

Python 中 文 社 区

Python中文开发者的精神家园

合作、投稿请联系微信:

pythonpost

— 人生苦短,我用Python —
1MEwnaxmMz7BPTYzBdj751DPyHWikNoeFS


640?wx_fmt=jpeg


版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/BF02jgtRS00XKtCx/article/details/78602648

【python 自然语言处理】对胡歌【猎场】电视剧评论进行情感值分析

主要内容 1、什么是SnowNLP? 2、SnowNLP可以干哪些事儿? 3、如何进行情绪判断? 4、猎场豆瓣热门短评抓取。 5、猎场热门短评情感分析。 6、附录(python 画词云图) 什...
  • u013421629
  • u013421629
  • 2017年11月20日 16:11
  • 1483

用 Python分析胡歌的《猎场》到底值不值得看?

專 欄 ❈作者:布道,互联网运维负责人。负责公司和电商平台运维技术工作,带领团队在公司推行DevOps,践行“自动化、平台化、可视化”运维理念。目前主要关注几个方面:1.平台开发,作出更...
  • BF02jgtRS00XKtCx
  • BF02jgtRS00XKtCx
  • 2017年11月22日 00:00
  • 1014

差评近一半,用 Python 分析胡歌的《猎场》到底值不值得看?

转自:CSDN blog.csdn.net/csdnnews/article/details/78591437 如有好文章投稿,请点击 → 这里了解详情 11 月 6 日,湖南卫视已经...
  • CSDN__DRAGON
  • CSDN__DRAGON
  • 2017年12月05日 15:13
  • 165

差评近一半,用 Python 分析胡歌的《猎场》到底值不值得看?

《猎场》到底好不好看?我们还是想通过以 11 月 8 日为界,看看人们短评人的情绪,是积极,还是消息。利用词云看看大家都说了什么,希望能大家就是否建议观看给出建议。...
  • csdnnews
  • csdnnews
  • 2017年11月21日 13:13
  • 28047

胡歌热播剧《猎场》遭差评 “程序猿”用自然语言分析揭真相

今年11月6日,湖南卫视开播年度压轴剧《猎场》以来,该剧迅速占领各大榜单,成为一部高热都的电视剧。但是在豆瓣上,对该剧的评价却形成了两极分化的态势。相比胡歌之前作品如:《琅琊榜》的9.1分,《伪装者》...
  • moluka
  • moluka
  • 2017年11月26日 00:34
  • 254

差评近一半,用 Python 分析胡歌的《猎场》到底值不值得看?

转载于:http://blog.csdn.net/csdnnews/article/details/78591437 作者 | 布道 11 月 6 日,湖南卫视已经开播被称作年度压轴的...
  • xavierri
  • xavierri
  • 2017年11月21日 17:47
  • 169

用 Python分析胡歌的《猎场》到底值不值得看?

11月6日,湖南卫视已经开播被称作年度压轴的大戏“猎场”,迅速占领各大榜单,成为一部高热度的电视剧。但是在豆瓣上却形成了两极分化。截止11月8日,该剧在豆瓣上的评分为5.7分。相比较胡歌之前《琅琊榜》...
  • zw0Pi8G5C1x
  • zw0Pi8G5C1x
  • 2017年12月17日 00:00
  • 250

用 Python 分析胡歌的《猎场》到底值不值得看,15篇 Python 技术热文

(点击上方公众号,可快速关注) 本文精选了 Python开发者 11月份的15篇 Python 热文。其中有网络爬虫,机器学习算法,区块链等 注:以下文章,点击标题...
  • iodjSVf8U1J7KYc
  • iodjSVf8U1J7KYc
  • 2017年12月01日 00:00
  • 410

数据分析胡歌猎场

请跳转至转载界面查看
  • m0_37392631
  • m0_37392631
  • 2017年12月01日 00:01
  • 109

【python 自然语言处理】对胡歌【猎场】电视剧评论进行情感值分析

本文基于python3.5编写,如果使用python2.7,只需要修改编码部分和print部分即可。 豆瓣猎场短评爬虫 # encoding: utf-8 ...
  • weixin_38197294
  • weixin_38197294
  • 2017年11月28日 21:34
  • 253
收藏助手
不良信息举报
您举报文章:用 Python分析胡歌的《猎场》到底值不值得看?
举报原因:
原因补充:

(最多只允许输入30个字)