python数据挖掘电影评分分析_豆瓣电影数据与票房数据分析

写在前面

在上次观看了比利.林恩的中场战事之后,开始进入了豆瓣的电影世界,对于一个新用户来说,特别喜欢豆瓣电影的影评,对于所看过的留下深刻印象的电影都在豆瓣上搜了一边,同一部电影,希望能看到与自己感受不同的观点,因为每一位观众都有着不一样的人生轨迹,看待事物的角度可能会有所不同,正是这种差异往往能引发思考。豆瓣的电影数据方面一直以来都比较权威,对于每一位热爱电影的观众来说都是很好的参考,受众小而专,影评和评分都比较客观。。吧!

关于数据

电影数据来源于豆瓣网站,已经爬完了所有的电影分类标签,总共抓取到的电影记录有34177条,其中没有电影评分的记录有6399条,这些都是经过去重和清理后的数据,清理指的是对于电视剧、真人秀、脱口秀等等的筛除,也就是说数据里仅仅包含电影。电影票房数据来源于电影票房数据库网站,记录不多,只有2577条,经过简单地去离群点与豆瓣电影数据混合后只剩下2353条。电影数据中包含电影名字、导演、主演、所属国家或者地区、电影类型、语言类型、评价人数、以及评分等等。

分析目的

从不同的角度来观测数据,查看各个参数之间的联系,发现实际的有趣的问题,大体上进行分析。

豆瓣的电影世界

一、从电影数量上观测数据

1、各国发行的电影总数

adb96acb75afdefcd0638bd0fc36050e.png

VigoLin

从直方图的显示来看,美国发行的电影数量最多,是位居第二的中国大陆的两倍还多,其次是日本、英国、香港、韩国…美国的电影数量在意料之中,美国经过漫长的电影发展史,到现在已经形成了庞大的专业“电影生产线”,韩国的电影数量有点出乎意料,只有1277部,当然这只是从所爬取的数据中观测到的。

2、21世纪各年度发行的电影数量

  • 1
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值