Python告诉你《你好,李焕英》票房超过唐三的秘密

本文使用Python爬取并分析豆瓣短评数据,揭示《你好,李焕英》如何从春节档黑马成为票房冠军。通过统计主演提及次数、评论者地域分布和关键词词云,展示了贾玲、张小斐和沈腾的角色影响力,以及电影的情感焦点。
摘要由CSDN通过智能技术生成

2021年的春节假期就这么结束了,本届春节档的中国电影总票房达到了78亿元!这还真是:就地过年催生“史上最强春节档”啊!

 

其中《唐人街探案3》率先打破多项记录,但因其广告植入又多又尴尬、剧情槽点过多等等差评使得口碑一度下滑,豆瓣评分更是从6.8分跌到了如今的5.6分,降到了烂片的行列。不过,它仍然进入了票房榜前五!

 

图片

 

与此同期,《你好,李焕英》从春节档第4天开始,不论是上座率、排片率、还是单日票房都实现了成功逆袭,成为春节档的最大黑马。

 

今天我们就用Python分析一下这位春节档的最大赢家——《你好,李焕英》!

 

图片

 

首先,我们要简单使用Python爬取豆瓣的短评数据。目前这部剧豆瓣上共有612433人进行评分,分数为8.1分,这种评分在国产剧中是很优秀的成绩了。

这里我们使用requests并搭配xpath来爬取豆瓣评价以及评论者的个人信息。

很多人学习python,不知道从何学起。
很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
很多已经做案例的人,却不知道如何去学习更加高深的知识。
那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!
QQ群:721195303

 

from lxml import etree

import requests

静待十几秒,就成功获取了500条豆瓣评论数据👇

 

图片

简单筛选,我们就可以从500条数据统计出主演提及次数,并利用pyecharts制作条形图。

bar = (Bar()
      .add_xaxis(x_df)
      .add_yaxis('提及次数', y_df)
      .set_global_opts(title_opts=opts.TitleOpts(title='《你好,李焕英》豆瓣评论中的主演提及次数')
                      ,visualmap_opts=opts.VisualMapOpts())
    )

bar.render_notebook()
 

图片

 

我们通过排序可以发现,贾玲饰演的自己,张小斐饰演的李焕英是观众评论提及最多的角色。

凭借《你好,李焕英》这部电影,贾玲成为了中国票房最高女导演!饰演她母亲李焕英一角的张小斐也因此一炮而红!

 

图片

提及次数第三名的是沈腾饰演的沈光林,许多网友们都在说“沈腾原本只是去客串《你好,李焕英》,结果一不小心成了主角,又一不小心成了150亿电影男演员。”

 

我们还可以用pyecharts来制作map地图,来展示评论者的地域分布:

 

图片

 

可以看到,豆瓣上给《你好,李焕英》评分的观众中,来自北京市的最多!

最后我们再利用stylecloud制作一个词云图,看看大家主要都在评论些什么?

stylecloud.gen_stylecloud(text=' '.join(text),
                         collocations=False,
                         icon_name='fas fa-chart-pie',
                         size=600,
                         output_name='./评论词云图.png')
Image(filename='./评论词云图.png')

结果如下:

图片

 

豆瓣评论中主要围绕的关键词有"母亲"和"女儿",以及对应的角色"贾玲"和"李焕英"。除此以外,"沈腾"、"穿越"、"反转"、"结尾"、"小品"等关键词也被多次提到。

 

上文就是我们用Python分析一下《你好,李焕英》这部叫好又叫座的电影了。不过只是使用 Python 简单给你演示一下数据分析的魅力,后续我们其实还能做深入的数据挖掘。而且,实际上数据分析除了获取数据,存储数据,还需要会对数据进行预处理,提取,然后分析,统计,报告等操作

 

如果你对使用 Python 数据分析感兴趣,想要拿到一份薪资不错的工作,但是目前还有些许茫然,有很多不清楚的地方,比如数据分析的学习路径是怎么样的如何制作精美的可视化视图如何进行股票量化等等

 

我这次特地总结了一张思维导图给大家,点击放大看更清楚哦。

 

图片

(点击查看高清大图)

 

基于此,我这里将我以前学习过程中用过的电子书(技能类、统计类、业务类),还有相关视频免费分享给大家,省去了你们挑选视频的时间,也希望能够对你们的学习有所帮助。

 

PS:我总结的资料有点多哦,差不多有4G,大家一定要给你的百度云盘空出位置来哦!

 

图片

(资料近展示部分)

 

免费领取资料和大厂直播课

在这里还是要推荐下我自己建的Python学习群:721195303,群里都是学Python的,如果你想学或者正在学习Python ,欢迎你加入,大家都是软件开发党,不定期分享干货(只有Python软件开发相关的),包括我自己整理的一份2021最新的Python进阶资料和零基础教学,欢迎进阶中和对Python感兴趣的小伙伴加入!

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

平静愉悦

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值