数据分析之《我不是药神》

前言

作为暑期最受欢迎的电影之一,《我不是药神》在上映之前就被刷屏,它不仅是豆瓣16年来第9部评分超过9.0的华语影片,也是第5部票房超过20亿的影片。记得小编当时还在学校未放假时,药神就在朋友圈被好友频频安利,于是一放假就迫不及待的去看了。看完给我的感觉就是中国这样的电影真的太少了,毫无疑问,它的成功是必然的。于是在其上映一个月后,小编想看看全国网友对药神的评价究竟如何,就做了关于药神的影评分析。


数据抓取

此次数据爬取我们参考了之前其他文章中对于猫眼数据的爬取方法,调用其接口,每次取出1000页的数据并进行去重,为了使最终的数据可靠性更高,小编抓取了多次当日的数据,代码如下:






数据分析

我们先来看下所得到的数据



这个数据是小编去重后所得的,并且按照了城市进行排序,后面的部分主要围绕评分、城市、评论展开。


首先看一下评分热力图




京津翼、江浙沪、珠三角等在各种榜单长期霸榜单的区域,在热力图中,依然占据着重要地位。同时,我们看到东三省和四川、重庆所在区域也有着十分高的热度,这表明药神的热度即使到现在也还是特别高的。


下面我们要看的是主要城市的评论数量与打分情况





打出最高分4.86的城市是无锡市,而最低分4.46是东莞市,而徐峥的家乡上海打分在4.6左右。综合各个城市的打分来看药神的评分还是比较高的。


我们按照打分从高到底对城市进行排序





在评论数量最多的二十个城市中,评论数量最高的是深圳,北京,其次是成都。而后15名的评论数量和评分都差不多。说明药神的口碑没有出现两极分化的现象。这也跟药神一直以来的评价所对应。


我们把城市打分情况投射到地图中:(红色表示打分较高,蓝色表示较低)





可以看出南北方对这部电影的评价都很高。这也是药神的票房之高的原因。


看过了评分,我们看一下评论生成的词云图,以下分别是原图和据此绘制的词云图







从生成的词云中可看出网友对药神的评价最多的是好看,现实,感人,真实,良心。这与小编在朋友圈中看好友所发的对药神的评价都是一致的。正如战狼2一样,把钱花在制作上,用心拍摄的良心大作,相信还是会有回报,国产电影是可以兼顾社会责任和商业利润的!用心做电影,时代不会辜负你,观众不会辜负你!正如一些网友评论所说,这是中国电影人的良知觉醒,应该多些现实题材的呼吁,反映民众的心声,告诉政府和社会我们需要做什么。


部分代码展示


热力图





折线图+柱形图组合







词云





本篇代码:

github.com/NGUWQ/yaosh…


此文思路来源于:数据森麟 “3天破9亿!上万条评论解读《西虹市首富》是否值得一看” 一文。


对爬虫,数据分析,算法感兴趣的朋友们,可以加微信公众号 TWcoding,我们一起玩转Python。


If it works for you.Please,star.


自助者,天助之




转载于:https://juejin.im/post/5b6fadb451882560fc512e68

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值