“大数据”时代的电影新猜想

漫画/李嘉



  2013年被称为“大数据元年”,源于互联网领域的“大数据”概念今年以来在影视行业迅速升温。特别是美国视频网站Netflix运用大数据投拍的电视剧《纸牌屋》大获市场成功,更是让全球影视界对大数据的运用刮目相看。这个海外成功的案例,对中国各大视频网站以及电影创作本身,甚至传统院线发行是个刺激。


  在刚刚过去的第16届上海国际电影节上,大数据也成为业界热议的一个话题。大数据分析正逐渐运用到电影产业的环节,这对整个影视创作行业,从剧本、导演、演员的选择,到拍摄和后期制作乃至营销,将会产生什么深刻的影响?大数据到底能否给中国电影产业带来发展机遇和新的猜想?


  数据能发现观众在哪儿?


  所谓“大数据”分析,指通过收集整理各个方面的海量数据,对其进行分析和挖掘,进而从中获得有价值的信息,并指导公司经营、提高效益的一种新的商业模式。大数据最先运用于互联网零售领域,今年开始被运用到影视行业。


  最近,谷歌公布了一份名为《用谷歌搜索量化电影魔力》的白皮书,宣称利用其电影票房预测模型,能够提前一个月预测电影上映首周的票房收入,准确度高达94%。该白皮书发现,一部电影相关的搜索量与票房收入之间存在很强的关联性(下图),根据搜索次数的多少可以判断票房成败,次数越多,意味着票房越成功。谷歌的票房预测模型正是大数据分析在电影业的一次应用。


  在电影界人士眼里,谷歌的预测票房模型还显得过于粗放,没有考虑用户年龄群体、消费心理等人为因素,准确率让人怀疑。但从搜索量出发,确实可以对票房有一定的预测作用。负责《致我们终将逝去的青春》、《小时代》宣传工作的麦特文化传媒总裁陈砺志介绍,《致青春》首映日百度搜索量为14万,《小时代》上映前夕百度最高日搜索量为25万,由此大致可以判断出两部影片的票房标准。结果,《小时代》首映日票房7000余万元,大幅超过《致青春》首映日4000余万元的票房。


  相对于预测票房,大数据对电影行业最直接的影响应该是营销。“中国电影市场在讲大数据之前,就数据而言一直是匮乏的。好莱坞从一个电影研发阶段,就得到不同的数据支持,片名、演员阵容、档期的确定等,从生产到销售都是由数据支持。”新丽传媒副总裁张文伯说,中国在几年前连一部电影的票房数据都不公开,观众反馈也只能通过抽样调查来实现,但覆盖范围毕竟有限。现在,通过网络搜索、视频播放、日志评论等海量数据,可以知道全国各地区、年龄、职业的观众群体情况,进行针对性营销。


  《小时代》就是运用大数据进行营销的一个案例。该片未映先热,微博搜索量更是《致青春》的8倍。通过数据分析,出品方乐视影业CEO张昭得出结论,该片40%的观众将是高中生,他们是郭敬明以及杨幂等主创的忠实粉丝,是《小时代》的冲动型消费者;30%是白领,他们对《小时代》感同身受,是营销导航的重点;20%则是大学生,他们是非核心消费者,但是能够通过传播从而影响这群人;另外10%为目前观影年龄在26岁至35岁之间的人群,他们是需要扩大外延的潜在观众。基于数据分析,乐视在全国数百家影院举办针对《小时代》目标人群的零点首映嘉年华,票房达到700余万元,可谓一举成功。


  “大数据对我们的意义在于,通过挖掘数据,发现这些观众在哪里,我们就可以把相应的电影推荐给他们,实现精准化营销。”专业从事电影营销的剧角映画总裁梁巍举例,比如根据优酷、土豆网的视频播放数据,就可以知道18岁至25岁的女性在每天什么时段喜欢看什么视频,然后把相关女性题材电影的预告片放给她们看,观众群体针对性更强,吸引她们进影院。陈砺志也透露,自己公司已经在做这类精准营销,如在推广《白鹿原》时就跟豆瓣网合作,这里的网友比较喜欢这类文艺片,可以把电影直接向他们推荐。


  拍什么电影数据能说了算?


  大数据对电影营销带来的影响,得到业界的肯定,似乎对影视内容制作也带来冲击。美国视频网站Netflix率先将大数据运用到26集电视剧《纸牌屋》,该剧主演是凯文·史派西,前两集导演兼全剧制作人是大卫·芬奇,剧本改编自上世纪90年代曾颇为走红的英国BBC同名剧集。今年2月1日《纸牌屋》第一季开播,一下子就火了。该剧无论是剧情设置还是选择演员、导演阵容,都以用户在网站上的行为和使用数据做支撑,从而受到观众热捧。


  Netflix收集每天网上产生的3000多万个用户行为,包括每个用户观看视频时会在哪里暂停、回放、快进,以及评论和搜索请求,将其记录下来并进行分析。Netflix或许并不能准确知道单个观众点击暂停按钮的个人原因,但是如果足够多的人在整段视频中的同一个地方做了相同的举动,那么数据就开始显露出意义了。结果,Netflix比观众还要清楚自己的观影喜好,他们根据大部分观众的喜好来调整剧情、主演等内容环节,最终根据官方公布的数据,四分之三的订阅者都会接受Netflix的观影推荐。


  国内视频网站爱奇艺正在做着类似的事情。爱奇艺CEO龚宇认为,大数据分析对剧本选择、主创阵容选择,拍摄和后期制作等影视剧的创作环节都会产生影响。他介绍,爱奇艺每天产生的日志文件数据量是每天新上线视频内容数据的300多倍,他们分析了网友关注度最高的前两千名的电影,分析不同地区的观众在关注什么电影,对剧情有什么不同嗜好。


  他以电影《人在囧途》为例,“《人在囧途》在院线的票房表现虽然平淡,但在网上的播放量甚至超过了《唐山大地震》,所以后来《人再囧途之泰囧》取得票房成功就不奇怪。”龚宇透露,另外一个著名导演拍摄的一部30分钟左右的微电影,视频播放量甚至超过《泰囧》,基于这个惊人的数据,爱奇艺正在筹备将这个微电影重新拍摄制作成一部大电影,进而了解大数据指导下的大电影是否能像预期的那样受欢迎。


  “电影根据网络文学改编,受到网络视频的启发,这还只是大数据的简单利用。”北京大学文化产业研究中心主任陈少峰认为,可以进一步发挥大数据的特色,如网友看过一部电影、视频后往往会发评论,要是把几千万条评论进行搜集、整理,就可以寻找出其中有利的东西做成品牌。“这样精细理解用户的爱好,对电影下一步创作肯定有指导性,电影创作和大数据的关联会越来越强。”


  实际上,目前国内电影界主要靠导演、制片人凭经验拍脑门决定项目,真正运用调研数据来决策、立项的不足10%,更不用说利用大数据了。“我们每年花费百万元向相关公司购买数据,利用数据来分析,选择什么演员、题材,在电影上映之后,用什么艺人来代言广告,都有很强的指导价值。”陈砺志说,比如拍一部功夫喜剧,可将近年来这种类型片的各种数据进行归纳,提供一份分析报告,降低投资风险。不过,他也提到,在投资电影项目过程中,大数据主要还是作为参考,并不能起到决定性作用。


  数据分析扼杀艺术家才华?


  “大数据在电影营销、宣传上有很大帮助,但对电影制作真的能起作用吗?”《北京遇上西雅图》的制片人姜伟对此表示怀疑,“电影行业很特殊,不是数据能分析得出来的,还是要用心来创作。我们制作的《北京遇上西雅图》这部电影是导演做了大量实地调查后,花了很大心血写出剧本才有了后来的成功。”他认为,通过数据分析得到一个结果,如观众年龄段、职业、消费习惯等,往往是事后的总结,很难预知三五年以后观众的消费习惯。比如《阿凡达》从准备到正式上映历时11年,很多美国观众都不知道这是一部什么样的电影,但它最后获得空前的票房成功,这是无法用数据分析出来的。


  中国电影制片人如果过分利用大数据来决定创作,结果或许是一场灾难。梁巍直言,制片方应该研究怎么拍出好电影,提升电影的质量,如果把所有精力放在数据分析上,那会很可怕。“数据分析非常重要,但它代替不了好莱坞,代替不了艺术家和创作者。”搜狐视频首席运营官刘春提醒,在大数据时代不要忘记艺术创作的重要性。


  拥有600万会员的万达院线也积累了大量数据,如观众的年龄群、消费喜好等,但目前数据库主要运用于影院营销和排片方面,并没有用于电影制作。万达文化产业集团副总裁叶宁解释,电影创作有着强烈的个人色彩,必须尊重艺术家的个性,要是按照大数据分析的一言堂来拍,必然是死路一条。


  业内人士认为,电影内容的生产基于大数据可以做更好的预测和分析,但作品的成功因素,关键还是看作品本身。正尝试根据大数据筹拍电影的龚宇也坦陈,即便通过大数据研究出作品规律,并不意味着就能拍出好电影。


  “观众是否喜欢看你的电影,取决于你的作品是否够好。电影行业有天才,创新才是方向,原创内容很重要。”姜伟说,二十多年前拍的《侏罗纪公园》今天看来依然是一部很震撼人心的大片,体现了导演斯皮尔伯格的天才创新能力,这跟所谓的大数据分析无关。


  也有电影界人士认为,《纸牌屋》的成功有其独特性,在于相关网站有着两千多万付费用户,而在中国视频网站,观众的付费习惯尚没有养成。中国视频网站主要盈利模式仍然是广告投放,这就意味着很难完全由用户去决定影视剧的演员、导演、剧本,也要考虑广告商的要求。大数据适合美国的投资制作方式,未必就适合中国影视行业。


  泛滥的不靠谱数据毁电影?


  电影行业利用大数据,实际上还处于起步阶段,且还存在诸多困扰因素。“这个行业离规范、专业还有很大的距离,很多数据都不靠谱。”梁巍感叹,现在电影投资的数据都靠不住,各个未上市的电影公司根本不会公开自己的投资数据。陈少峰也坦言,自己每年编《中国文化企业报告》,采集数据特别困难,因为有些文化公司的营业额数据根本就是假的。


  国内市场还缺乏成熟的透明度,如视频网站的流量、院线的票房数据,都包含很大的水分,这让数据的真实性、公信力都难以保证,数据分析和挖掘就更难了。网络上还充斥着水军、枪手,在每部电影上映前后都会大量打分、发帖、评论,而这种数据是无效的,必须加以辨别、删除,也增加了数据分析的难度。


  更要紧的是,各个公司对自己的数据都是绝对保密,缺少公共数据的平台。如优酷、乐视网、万达院线等都有各自的数据库,但并不会彼此共享,而是当作各自的核心竞争力之一。单凭一家公司的数据,显然并不足以做整个行业的大数据分析。陈少峰认为,“这些公司相互分享数据是不可能的,以后可能做营销调查的公司会成为大数据主力军,通过专业技术来收集数据。”


  相比之下,好莱坞制片方利用大数据就方便得多,各个领域的数据都相对开放,可以很容易用大数据来判断电影项目的运营。“人家的电影工业体系很完善,市场调研非常发达,大数据可以起到辅助作用,帮助电影产业实现更加精细化运营。”梁巍说,国内电影公司要想运用大数据,就必须跨界合作,如剧角映画就在跟淘宝网、京东网等网络、移动平台合作,但后者的数据对电影营销意义有多大,目前还不知道,双方合作尚处于非常初级的阶段。


  就目前国内的技术水平而言,大数据开发尚显得心有余而力不足。比如爱奇艺每天产生庞大的日志文件,但由于受到IT技术、数字模型的限制,爱奇艺其实只挖掘了很小的一部分,并没有能力进行完全处理。叶宁也坦率地说,万达院线积攒的观众数据库是一个矿藏,但现在还不具备能力运用,等待合适时机再挖掘。事实上,运用大数据的成本很高,技术要求也很高,必须有先进的云计算进行处理,降低成本才能普遍运用。


  对国内电影公司而言,谁领先使用大数据,似乎至少在电影营销领域会走在前沿,竞争力会有所增强。大数据这个概念是对电影行业的思想解放,是一次技术和艺术的融合,最重要的是打破了过去的思维模式。但张昭略显担忧地认为,国内还不宜太早利用大数据来做电影、赚票房,不要为了商业目的急功近利,过早把电影行业的一次大发展机遇毁掉。



  不要神化大数据


  对国内电影界而言,“大数据”这个新生事物,无疑具有一定的新鲜和神秘感。伴随社交网络在中国的兴起,大数据体现出来的社会计算功能,与社交网络时代相匹配,必定会发挥出它独特的威力。大数据被引入到电影行业,也意味着把IT行业的技术运用到电影行业,这种跨界合作值得期待。但大数据毕竟是一个工具,我们不必把它过于神化,更不能用技术来压倒艺术,弄得本末倒置。


  近年来,国内电影产业飞速发展,票房年年激增,产业规模不断扩大。这种跨越式的发展,有利于吸引其他行业的加入,共同提升电影行业的产业水准。不可否认,目前国内电影行业还处于粗放经营阶段,产业的各个环节都不够专业化,各种行业外的热钱更是浑水摸鱼,胡乱投入电影界。此时引进大数据分析技术,有益于提升电影行业的专业化和科学化水平,引导投资更加理性,不能不说是一件好事。如最近票房惨败的《光辉岁月》,要是能够利用大数据分析,其投资方一定不会像现在这样盲目。


  但也要看到,如今是信息爆炸的时代,海量数据又容易让人迷失,制作方如果缺乏足够的洞察能力,缺乏足够的理性判断能力,一头扎进数据的海洋,恐怕会被数据淹死。看到网络上什么题材热门,马上就跟进拍电影,未必会赚得票房。事实上,网络热点往往只有三五天的寿命,而拍电影需要至少半年以上的时间,要是盲目跟踪网络热点,也许适得其反。


  更重要的是,当下中国电影创作最急需解决的问题并不是数据分析的缺失,而是题材类型片的单一,以及电影本身品质普遍不高。国产片除了武侠动作片、爱情片、喜剧片之外,其他类型片都少得可怜,根本满足不了观众的需求。最近半年来,《人再囧途之泰囧》、《西游降魔篇》、《中国合伙人》等影片大卖,连投资方都不敢相信自己的眼睛,这是很难用大数据分析出来的。实际上,这些影片能票房大丰收,并不是说影片本身水准有多高,而是市场极度饥渴,需要有这些类型片来填充。


  假如电影界沉迷于以往票房成功影片的数据分析,炮制出一堆类似的影片,其结果对电影行业有害无益。眼下国内电影界只有潜心拍出类型更丰富、艺术和商业价值兼备的影片,才能真正吸引更多观众走入影院。就此而言,大数据起不到那么大的作用,归根结底还是要靠电影主创的创作能力。

灵玖软件,大数据搜索与挖掘技术服务商 灵玖软件专注于大数据搜索与挖掘的技术创新与服务,提供大数据搜索、大数据挖掘与大数据应用解决方案,以应对大数据的管理、处理、分析并从大数据中获知识与智慧。
灵玖软件:www.lingjoin.com
大数据论坛:www.bigdatabbs.com

 

大数据技术已经成为互联网后的又一个里程碑意义的科技革命与生产力革命,也是产业结构战略调整的战略机遇。如何管理自身的业务大数据,从中获取智慧,对传统业务再造并实巨大价值的产品和服务?如何将大数据困境转换为大数据宝藏?如何从大数据概念炒作到实践落地?

由北京理工大学大数据搜索挖掘实验室、中国科学院计算技术研究所教育中心联合主办,大数据论坛联合承办,开设大数据技术进修班。聘请北京理工大学赵燕平教授、张华平博士、北京市外办信息中心姜伟主任、清华大学马宝君博士等知名专家全面讲授大数据架构、大数据搜索、大数据挖掘以及大数据应用四大板块,分享亲身经历的大数据应用,并为学员提供大数据搜索挖掘工具的实训。

授课时间 9月7、8日上午9:00-12:00,下午13:30-16:30 ( 16:30-17:00 开放式讨论答疑 )

 

进修费用 4980元 (包含发票,讲义,教材,工作餐,与讲师互动自助晚餐会);老学员或同单位三人以上报名九折优惠; 全日制学生凭学生证优惠价格2980元,不含发票。差旅及食宿费用自理。

授课方式 :(a)《大数据搜索与挖掘》教材(科学出版社); (b)中文多媒体讲义;
             (c) 针对学员具体需求的互动交流会。 (d)大数据搜索与挖掘工具实训;

(e)互动自助晚餐会;

主讲讲师:张华平:北京理工大学大数据搜索挖掘实验室主任,博士,副教授
             赵燕平:北京理工大学教授,教育部电子商务专家
             姜伟:北京市外事办信息中心主任
             马宝君:清华大学搜索评价与推荐系统专家

小班授课:为保证充分讨论,确保进修效果,采用小班授课,名额有限,先到先得。

培训内容:《科学的大数据观》《云计算与大数据架构》《大数据精准搜索关键技术》           

          《大数据挖掘关键技术》《大数据搜索与挖掘平台工具实训》  

          《大数据与电子商务应用》《大数据在电子政务中的应用》《微博大数据挖掘》  

          《大数据困惑及解决》《方案应对讨论》

主讲师张华平:张华平博士,北京理工大学副教授,研究生导师,知名汉语分词系

                   统ICTCL  AS的创始人,计算机学院院长助理,大数据搜索挖掘实

                   验室主任,中国计算机学会高级会员,中国中文信息学会社会媒体

                   处理专业委员会常务委员,同时担任首都师范大学兼职副教授,辽

                   宁师范大学客座教授,国家自然科学基金函评专家,北京市重点产

                   业知识产权联盟专家、同时担任《计算机研究与发展》、中国科技

                   论文在线等杂志的特邀评审专家。2005年博士毕业于中科院计算所,

                   研究方向为:微博计算、自然语言处理、信息检索与信息安全、大

                   数据搜索与挖掘。曾先后获得2010年度钱伟长中文信息处理科学技

                   术奖一等奖,中科院院长优秀奖、中科院计算所所长特别奖,中科

                   院计算所“百星计划”首批入选者。张华平作为课题组长主持开发

                   了国家自然科学基金、863、973、242等科研课题十余项,发表《大

                   数据搜索与挖掘》《信息检索:算法与启发式规则》《自然语言理

                   解》等专译著3部,所研制的ICTCLAS分词系统已经向国内外的企业

                   和学术机构颁发了三十万多份授权,在学术界和产业界得到了广泛

                   的应用。并作为特邀技术专家,先后在全国网络侠客行大会、全球

                   大数据技术峰会、中国网络科学大会上做大数据相关的主题演讲,广

                   受好评。

报名地址:http://www.lingjoin.com/lingjointrain/#add06

赵老师   010-68918050    13681251543



 

转载于:https://my.oschina.net/u/1160813/blog/142528

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值