2015年至2017年的国产电影圈的数据分析

说起国产电影,相信很多人就像是对待中国足球的态度一样,骂国产电影在这几年几乎都成了“政治正确”了。

那我们今天从数据上来看一看2015年至2017年这三年,国产电影的现况究竟是如何。

下文中出现的所有数据,除了票房信息来自猫眼电影外,其他数据都来自豆瓣网。

数量

每年拍摄的很多电影由于各种原因,最终没有在电影院内上映,所以也无缘和大部分观众见面,我这里只统计在国内上映过的国产电影。

年份电影数量平均评分
2015年1245.773
2016年1335.490
2017年1485.739

从平均评分来看,分数也相对比较平稳。算出结果的时候,还是比我预想的评分要好,按照我们读书时的经验,得分到60%就算及格,那么国产电影的平均水平也差不远了。然后我突然想到,豆瓣评分的最低分是 2 分,而我们读书时,最低分是 0 分,这样一看,国产电影确实还应该努力。当然,我并不认同评论一部电影的好坏,只从评分来看。评分只反应的是一个大众对电影的平均态度。

电影类型

每个国家或者地区的电影,都会给人一个固有的印象。都说喜剧是国产电影给人的固有印象,我们来看看是否真是这样。

2015年2016年2017年
喜剧4840
动作2417
剧情3551
爱情1216
悬疑1417
动画610

由于豆瓣在这个数据上非常不规则,比如有一些电影信息里面没有填写类型,有的电影可以划入多种类型,所以这个数据不是太准确。能看个表象,从写有类型的电影粗略估计,每年都有超过三成的电影为喜剧电影。喜剧类电影确实挺多的。

高评分电影

评分不是评价一个电影是不是好电影的唯一标准,但是可以反映大部分观众对电影的态度。

本来想以 8 分为标准来截取,才发现能上 8 分的国产电影确实太少了。国内观众对待国产电影的态度也相对比较苛刻,对待自己的 “孩子”更严格一点,故下调 0.5 分,以 7.5 为界来划分高分电影。

在统计的过程中发现,有一些电影分数很高,但是我从来都没有听过,比如:《狐妖小红娘剧场版:月红篇》,评分 9.2,发现评分人数只有 1052 人,像这个太小众的情况,也排除掉,为了防止是粉丝电影,粉丝电影不具有代表性。 所以不仅分数要满足大于等于 7.5,还有取电影评分人数还要大于 10000 的。

  • 2015年
电影名称评分评分人数
西游记之大圣归来8.2382136
十二公民8.2137371
师父8.1150988
老炮儿7.9413852
烈日灼心7.9254624
我的少女时代7.8292191
山河故人7.8121727
解救吾先生7.8198969
可爱的你7.827337
一个勺子7.779272
寻龙诀7.5348018
  • 2016年
电影名称评分评分人数
驴得水8.3326646
湄公河行动8366526
幸运是我7.918804
我不是王毛7.829609
喊·山7.716188
路边野餐7.767543
罗曼蒂克消亡史7.6205778
七月与安生7.6276475
追凶者也7.6119814

- 2017年

电影名称评分评分人数
相爱相亲8.570287
嘉年华8.384542
不成问题的问题8.221956
一念无明7.950102
大护法7.8181844
芳华7.8300853
冈仁波齐7.772443

这是一个令人不安的结果,2015年有 11 部电影超过 7.5,2016 年减少到 9 部,2017 年减少的 7 部。总体数量上一年比一年多,而高分电影却越来越少。

  • 这三年的年度评分最高电影

    • 2015年

      ​ 《西游记之大圣归来》 8.2 分

      ​ 《十二公民》 8.2 分

    • 2016年

    ​ 《驴得水》 8.3 分

    • 2017年

    ​ 《相亲相爱》 8.5分

低分电影

高分看过来,我们再来看看低分电影。

先说一说我的筛选标准,我是以 4.5 分作为分界线,因为高分电影是以 7.5 分为分界线,7.5 和满分 10 分差 2.5分,那么低分电影也应该与最低分差 2.5 分,而豆瓣的最低分为 2 分,综上按照 4.5 分以下的为低分电影。

  • 2015年
电影名称评分评分人数
横冲直撞好莱坞4.561676
既然青春留不住4.514272
冲上云霄4.439530
神探驾到4.411212
怦然星动4.244182
北京纽约4.212173
钟馗伏魔:雪妖魔灵4.259801
九层妖塔4.2124965
新步步惊心4.118213
宅女侦探桂香4.119731
栀子花开4.184576
我是女王4.114254
白幽灵传奇之绝命逃亡4.110133
恶棍天使489753
爸爸的假期411930
新娘大作战3.942885
何以笙箫默3.696871
王朝的女人·杨贵妃3.634282
从天“儿”降3.414343
奔跑吧兄弟3.335854
汽车总动员2.316151

  • 2016年
电影名称评分评分人数
超级快递4.510525
我最好朋友的婚礼4.317353
极限挑战之皇家宝藏4.326522
外公芳龄4.312665
摆渡人4.1153071
致青春·原来你还在这里475276
那件疯狂的小事叫爱情3.910276
爵迹3.992097
惊天破3.917760
梦想合伙人3.923559
谋杀似水年华3.811395
奔爱3.717696
大话西游33.645382
王牌逗王牌3.425560
我的新野蛮女友3.411165
封神传奇2.940931

- 2017年

电影名称评分评分人数
妖铃铃4.539657
奇门遁甲4.551394
麻烦家族4.511819
合约男女4.410461
密战4.414669
鲛珠传4.321646
青禾男高411470
三生三世十里桃花3.9138259
京城81号23.816778
大闹天竺3.867959
李雷和韩梅梅3.617297
东北往事之破马张飞3.613214
欢乐喜剧人2.613467
纯洁心灵·逐梦演艺圈2.141051

实际上我查出来的数据的名单更长,我把评论人数低于 10000 全部剔除掉了。

看到这个评分,我都能想象到大部分人是抱着怎样的心情去评论的。

票房情况

年度票房前三

  • 2015
电影名称票房收入类型评分评分人数
捉妖记24.4 亿喜剧,奇幻6.8267717
港囧16.1 亿喜剧5.6220041
夏洛特烦恼14.4 亿喜剧7.4378287

- 2016

电影名称票房收入类型评分评分人数
美人鱼33.9 亿喜剧,爱情6.8417057
西游记之孙悟空三打白骨精12.0 亿喜剧,动作5.698723
湄公河行动11.8 亿动作8366526

- 2017

电影名称票房收入类型评分评分人数
战狼256.8 亿动作7.2477506
羞羞的铁拳22.1 亿喜剧7.1311396
功夫瑜伽17.5 亿喜剧,动作5107981

国人实在是太喜欢喜剧电影了,这九部电影中,只有两部是单纯的动作片,剩下的全都是喜剧类型的电影,这个分类是豆瓣给的,不太懂的是《西游记之孙悟空三打白骨精》怎么也分到喜剧类型去了。

这里不得不提一下开心麻花,开心麻花三部曲,《夏洛特烦恼》,《驴得水》,《羞羞的铁拳》,其中两部都挤进了国产电影票房前度前三的行列,而《驴得水》是 2016 年国产电影评分最高的国产电影。更有趣的是《驴得水》的票房收入是 1.73 亿,但是电影评分人数是 326646,评分的人数和《夏洛特烦恼》的 378287,《羞羞的铁拳》的 311396,实际上差不太多,而票房收入却差别巨大。三部电影的评分人数都是非常的大了,足以说明开心麻花每部电影上映时,都能引起巨大的效应,票房口碑双丰收。

同时这里也心疼心疼《十二公民》这个电影,由于《十二怒汉》一直是我很大爱的电影,所以比较关注,翻拍的《十二公民》本土化地也很好,在豆瓣上的评分人数 137371,但是票房 1397 万 。说明影响力还是不错的,但是看这部电影的很多观众并不是在电影院观看这部电影的。这就是国产电影典型的一个怪现象,用心制作的电影赚得口碑,却没有市场。在这个榜单中有两部电影的评分人数是少于《十二公民》的,《西游记之孙悟空三打白骨精》和《功夫瑜伽》,有趣的是票房都是《十二公民》的一百多倍。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
一、数据分析项目介绍 1. 项目所需的模块库介绍 pandas用法: 需要导入以下模块 import numpy as np import pandas as pd from pandas import Series, Dataframe 2.项目背景介绍 互联网电影资料库(Internet Movie Database,简称IMDB)是一个关于电影演员、电影、电视节目、电视明星和电影制作的在线数据库。电影作为艺术和娱乐载体已成为我们生活中的一部分,作为电影爱好者之一,希望通过分析了解电影市场大体情况,以便于以后选择电影观看。 使用的数据是IMDB美国票房排名前1000的电影数据,数据包含了电影名称,票房金额,上映份,演职人员,IMDB评分,电影类型等信息,数据中的很多电影大家也比较熟悉。相信不少人都有这样的经历,当想要看一部电影的时候,会去百度一下谁是导演,谁是主演。如果导演是克里斯托弗•诺兰,心里已经给电影打了个8分以上的评分了。而阿汤哥的动作片,预期也都能肾上腺素飙升。对于已上映的电影,不少人会去豆瓣搜索现时的评分,或是前作的评价,若是豆瓣高分、高评论数,也会按奈不住去蹭下热度。如果要去电影院观看的话,想必不少人会更倾向选择动作片或者科幻大片这类特效丰富,影音冲击强烈的电影。近几特效技术和3D动画的日渐成熟,影院观影已经是越来越多人的第一选择。 IMDB的资料中包括了影片的众多信息、演员、片长、内容介绍、分级、评论等。对于电影的评分目前使用最多的就是IMDB评分。 截至20186月21日,IMDB共收录了4,734,693部作品资料以及8,702,001名人物资料。 3.项目所需数据介绍 数据的属性包括:电影名称、评论数、评分、导演、上映时间、上映国家、主要演员、语言、IMDB评分等。 理解数据: color 、director_name 、num_critic_for_reviews、duration、director_facebook_likes 、actor_3_facebook_likes、actor_2_name 、actor_1_facebook_likes 、gross 、genres 、actor_1_name 、movie_title 、num_voted_users、cast_total_facebook_likes 、actor_3_name 、facenumber_in_poster 、plot_keywords 、movie_imdb_link 、num_user_for_reviews、language 、country、content_rating、budget、title_year 、actor_2_facebook_likes 、imdb_score 、aspect_ratio 、movie_facebook_likes 4.项目功能详细介绍 显示电影评分分布的情况; 电影数量与平均分度变化的情况; 评论家评论数与评分的关系; 评分与电影票房的关系电影数量大于5前提下平均分前十的导演推荐的数据; 不同电影类型的份累计分析; 电影时长的分布及时长是否和评分有相关性; 电影时长的分布及时长是否和评分有相关性。 二、数据分析过程 1.主要功能实现的类和方法介绍 # 清洗runtime电影时长列数据,可使用str.split()方法 df['runtime'] = df['runtime'].str.split('').str.get(0).astype(int) df['runtime'].head() # 清洗year列,使用str[:]选取份数字并转换成int类型,使用df.unique()方法检查数据 df['year'] = df['year'].str[-5:-1].astype(int) df['year'].unique() 2. 数据分析过程代码和解释说明 导入包: 导入、查看、清洗数据: 评分分布图: 电影数量与平均分布度变化: 评论家评论数&评分、评分&票房: 电影数量大于5平均分前十的导演: 统计不同份、不同类型电影的数量: cumsum = df.groupby(['main_genre', 'year']).title.count() # 使用累加功能统计1980起不同份不同电影类型的累计数量,对于中间出现的缺失值,使用前值填充 genre_cumsum = cumsum.unstack(level=0).cumsum().ffill() # 只选取总数量大于50的电影类型数据 genre_cumsum = genre_cumsum.loc[:,genre_cumsum.iloc[-1,:] >= 50] # 根据电影类型统计数据作图 fig, ax2 = plt.subplots(figsize=(12,6)) genre_cumsum.plot(ax=ax12, legend=False, linewidth=3) # 添加数据标签 for i in last_row.iteritems(): if i[0] == 'Adventure' or i[0] == 'Biography' or i[0] == 'Horror': ax2.annotate('{} {}'.format(int(i[1]), i[0]), xy=(2018.5, i[1]-5), fontsize=12) else: ax2.annotate('{} {}'.format(int(i[1]), i[0]), xy=(2018.5, i[1]+5), fontsize=12) # 美化图表 ax2.set_title('The Aggregate Movies of Different Genres Over Years', fontsize=16) ax2.spines['top'].set_visible(False) ax2.spines['right'].set_visible(False) ax2.spines['left'].set_visible(False) ax2.tick_params(bottom=True, labelleft=False) ax2.set_xlabel('') plt.tight_layout() 电影时长的分布及时长是否和评分有相关性: fig, ax4 = plt.subplots() df['runtime_min'].hist(range=(70,210), bins=14, color=(114/255,158/255,206/255)) ax4.set_title('The Runtime Distribution of US Top Box Office Movies') ax4.spines['top'].set_visible(False) ax4.spines['left'].set_visible(False) ax4.spines['right'].set_visible(False) ax4.set_xticklabels(np.arange(70,220,10)) ax4.set_xticks(np.arange(70,220,10)) ax4.grid() 绘制时长和IMDB评分相关性: fig = plt.figure(figsize=(14,7)) sns.lmplot(data=df, x='runtime_min', y='imdb_rate') sns.despine() 三、数据分析结果评估 1、评分分布主要在5.0~8.0之间,3.0以下和9.0以上分布很少。如果8.0算为优秀,则优秀电影占比较少。 2、电影数量在1990~2000间快速增长,2009达到较高值。而电影的平均分整体上呈下降趋势。 3、评论家评论数与评分整体呈正相关关系,500以上评论家评论数对应的评分都高于6.0。 4、评分与票房整体呈正相关关系,但关系不强。 IMDB评分人数和电影票房的相关性很弱,高票房不代表评分人数多,低票房电影也能有大量的IMDB评分人数。 5、电影数量大于5平均分前十的导演:Christopher Nolan、Quentin Tarantino 、 Stanley Kubrick、 James Cameron 、Peter Jackson 、Alejandro G. Iñárritu 、David Fincher 、Martin Scorsese 、 Wes Anderson 、Paul Greengrass。 6. 前五大电影类型分别是动作片Action,喜剧片Comedy,动画片Animation,剧情片Drama,冒险片Adventure。1995之前,动作片和喜剧片都是影院观众最喜爱的电影类型,对应的高票房数量不分伯仲,剧情片是另一相对流行的电影类型。1995后,高票房的动作片快速增长,甩开了喜剧片。喜剧片随仍是高票房数量第二多的电影类型,但近几增速明显放缓。高票房动画片进入榜单的时间最晚,但在1998前后迎来明显增长,此后的十里完成了对剧情片和冒险片的超越。如果动画片保持目前的增速,有望在之后的十几二十里超越喜剧片,成为高票房数量第二的电影类型。 7. 时长和IMDB评分呈一定的相关性,时长短的电影既有高分也有低分,但时长超过160分钟的电影基本都能获得6分以上的分数,时长最长的两部电影甚至得到了接近9分的超高得分,IMDB评分接近或低于4分的电影时长均小于130分钟。丰富的剧情和长长的故事也许也是一种容易感染观众的方式,这也和之前提到的好的故事打动观众相呼应。 四、总结 数据分析的过程往往是一个从宏观到微观的过程。先从宏观上把握数据大体的情况,大胆地提出假设,然后再将数据进行细分,小心地求证。通过数据的对比,就很容易看出调整的效果。 有关活动效果的数据分析往往也会涉及数据的对比。具体的思路是从要分析的目的入手,首先思考造成这种情况的可能原因有什么,再从每个可能的原因中找到相应的数据,与要分析的目的的数据进行比较,看哪一个是造成该情况发生的主要原因。 这里要用到的是excel的图表工具,把每一种可能的数据都作出一个图表,与要分析的目的的数据图表进行比较,如果有某一个数据的变化曲线与之相差不多,则可以说这个所对应的原因是造成该情况发生的主要原因。 以上是分析活动的一些核心数据,核心数据的分析是最主要的,因为这直接反应了该活动最本质的效果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值