作者:菜鸟哥
来源:菜鸟学Python
前些日子潘老师领衔主演的《鬼吹灯之龙岭迷窟》,让盗墓题材的影视剧再次热起来,这股热乎劲还没过去多久,紧接着,这些天,又另一盗墓小说《盗墓笔记》改编的电视剧《重启之极海听雷》又跟大家见面了。
同样是盗墓题材类的影视剧,而且主角是当红演员朱一龙。豆瓣上给出了7.8分的评分,说明制作上和演员的表演也是过关的。今天小编就带领大家来爬取一下大家对这部剧的评论,看一下大家是如何看待这部电视剧的。
1
数据的抓取
首先是对于数据的抓取,小编获取的是爱奇艺下每集电视剧中,观影者对于该集的评价,小编爬取了前五集的一共6万条评论。我们首先需要明确该去如何获取数据呢,如下所示:
我们首先需要根据动态加载的评论,按键盘的F12,打开开发者模式,在开发者模式的network里找到评论的json数据,然后根据其请求的url链接来构建我们的爬虫程序。小编根据上述步骤,写出了对应的爬虫层序,其部分核心程序如下图所示:
上述程序中,首先需要根据基础的url链接,构建实际的爬虫链接,然后获取返回的json数据,并对json数据进行解析,获取我们需要的数据。这里,小编获取到的是评论者的用户名、性别、评论内容,被点赞数和评论的时间等信息。一共有6万条数据。
2
数据分析
在获取到数据之后,接下来就是对于数据的分析了,从数据中,我们能够获取到非常多的有趣的内容。首先,由于朱一龙的存在,所以我们首先要看的就是评论者的性别分布,如下所示:
可以看到,忽略0.8%的性别未知的观众,评论这部影视剧的女性远远超过了男性,女性评论者数量达到了男性的四倍以上,而这里里面的女性评论者绝大部分都是冲着男主朱一龙来的,这里我们在后面的词云分析中也能看出。
对于每一位评语,我们可以看到,绝大多数人的评语都没有收获到点赞,这也符合我们的认知,因为爱奇艺只会将精彩的评论置顶,因此绝大部分评论都不会有观影者特地去点赞。收到0条点赞也是正常的。
对于每集评论数量的分布,可以看到,随着剧集的发展,每一集的评论数量也随之缓慢的下降,当然,这也跟电视剧播出的时间是有很大的关系的,毕竟播出时间早的剧集,评论的人数概率上比后播放的人数自然要多。
对于每天的评论数和点赞数,如下图所示:
可以看到,从8月5日到8月9日的这五天时间里,评论数量发生了巨大的波动,从8月7日开始,评论数量出现了巨大的滑坡,但是点赞数量已经保持着稳定的水平。
对于大家的评论,我们来看一下是如何大家的看法:
对于这部电视剧,很大一部分观众是冲着男主角朱一龙来的,无论是他本人还是饰演的“吴邪”角色。这与前面关于观影者以女性居多相呼应。此外这部剧大家的评论也是不错的,认为比较好看,喜欢这部电视剧。
以上就是小编为大家带来的关于《重启之极海听雷》这部影视剧的数据抓取和词云分析,欢迎大家留言吱一声,说一下你心中关于这部电视剧的评论。小编也正在追这部剧,个人认为是比较不错的,也会持续的追下去,嘿嘿。
◆ ◆ ◆ ◆ ◆
麟哥新书已经在京东上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前京东正在举行100-50活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的:
点击下方小程序即可进入购买页面:
数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。
管理员二维码:
猜你喜欢
● 麟哥拼了!!!亲自出镜推荐自己新书《数据分析师求职面试指南》● 厉害了!麟哥新书登顶京东销量排行榜!● 笑死人不偿命的知乎沙雕问题排行榜
● 用Python扒出B站那些“惊为天人”的阿婆主!● 你相信逛B站也能学编程吗点击阅读原文,即可参与京东100-50购书活动