SACC2019 | 爱奇艺的大数据中台战略(附演讲实录)


摘要:随着AI和大数据的发展,以及云计算能量的释放,爱奇艺的娱乐大数据的规模化效应呈爆炸式增长,高速发展的业务需要一个健壮稳定的中台去支撑,爱奇艺大数据中台应运而生。


嘉宾介绍


孙斌 爱奇艺高级总监

主要负责 爱奇艺的大数据中台、商业智能、内容智能制作等业务。 在互联网产品设计和研发方面有十多年经验,曾就职于微软、hulu、雅虎等公司。

本文着重介绍爱奇艺大数据中台战略的由来、发展以及对公司和行业的影响,将会覆盖大数据中台的历史、基础架构、落地赋能应用以及未来的发展方向,也涵盖爱奇艺对整个泛娱乐行业数据驱动业务的理解。

爱奇艺大数据中台战略



大数据中台的这个概念,在行业里被提出差不多四五年时间。 与此同时,爱奇艺已经做了很久关于中台的事情。 大家第一反应可能是一个视频播放平台虽然体量比较大,但是场景单一,为什么会需要大数据中台或者更强大的中后台来支撑?

640?wx_fmt=jpeg

大家会通过各种各样的APP看到不少讲“大中台小业务”,这就允许我们前面做各种各样的业务迭代、业务尝试。 坦白来讲,很多公司都在做中台,但重要的是能不能很好的把相关数据资产沉淀下来。

爱奇艺曾提出过一个概念: 苹果园。 因为早期爱奇艺是视频业务,后来从视频业务周边衍生出来一些新的业务,这便是我们的苹果树模型。 从苹果树的模型往下延伸,远远不是跟视频场景周边相关的,我们不仅可以在场景上做各种各样的关联,还可以在人群中做各种各样的关联。

我们提出从苹果树,到苹果园泛娱乐生态矩阵。 简单地说,爱奇艺有长视频、短视频、小视频、奇巴布、爱奇艺阅读、叭哒、泡泡、奇秀直播、爱奇艺知识、体育、电商等等。 以下是爱奇艺的产品矩阵。

640?wx_fmt=jpeg

针对中台战略的“金字塔”,从底部往上,分别是数字资产沉淀、统一数据平台|技术内核工具、业务互动三个层面。 抛开商业模式,纯粹从用户角度看爱奇艺,爱奇艺最主要两个东西是: 用户(人)和内容(IP)。

640?wx_fmt=jpeg

讲到数字资产,重点核心关键词是“统一”。 所有不同的东西,我们如何把它能够关联起来。 大数据中台在这里面体现的是OneID,如果真正把OneID人、物串起来,最终实现在这基础上各种各样的广告投放、内容变现都有可能。

640?wx_fmt=jpeg

再讲数字资产沉淀,当你把用户和内容进行实景兑现化,一定要把它在逻辑上放到一个统一的大数仓,才有可能在此基础上进行各种各样的计算。 并不是说,非物理存储上在同一个地方。 数据中台概念是我在逻辑上对所有数据进行管控,所有血缘、上下游关系清晰记在册的,基于这上的数字资产管理才变得有序。

640?wx_fmt=jpeg

左侧最上层基础上,对各种各样的复杂业务场景,智能硬件场景、爱奇艺阅读、爱奇艺视频场景,如何让所有行为让机器认识而且明白中间的关联,除了OneID之外的行为,在此行为上用户分析才能真正有意义。

这里有个关键是“主题”,比如所有付费的会员业务这是一个主题,电商业务也是主题,奇秀直播业务也是主题。 如何能够让数据结构后面去利用好大数据中台,更好地去实现业务上的诉求,这里面有一个业务主题的概念,这也是我想突出的。

中间统一管控加上规范化,再到这一端开始发挥价值。

比如投资资产,在一些IP我们要做全生命周期的管控,也许有可能它只是一个概念或者仅仅有一本比较古老的小说的时候,怎么能够发现它潜在的价值? 第二块是用户增长,这个是最近比较火热。 最后一块讲数据赋能,比如大家知道的数据赋能广告、数据赋能风控等。

讲了这么多资产沉淀,到底大数据平台是什么样的,中间层统一大数据平台和技术内核工具。 我重新再强调一个关键词 “统一”,在此基础上再加一个关键词“透明”。

640?wx_fmt=jpeg

大概在三个月前,我们团队刚刚做了大数据沙龙,专门分享了数据治理。 数据治理这一块就是让所有的数据有序且对上对所有的上层业务透明,而是指所有业务关系、血缘关系,所有地图都可查而且非常有利于理解。 在此基础上突出非常重要的关键词“透明”。

还有一个关键词是“兼容”,大家看爱奇艺有那么多业务,有些是爱奇艺自制的,有些是合作的,如何实现所有这些东西兼容? 比如存储上的兼容、通讯引擎上的兼容、地域上的兼容等。 再往上是大家非常熟悉的关键词,比如画像标签、行为标签。 最底层是所有数据的接入,用户全域数据、IP数据以及外部交换数据。

640?wx_fmt=jpeg

上图大数据平台的架构,其实各家所用的技术栈各个方面差别不大,主要有两点,第一点如何能够很好的服务于不一样的独立业务场景,如何能够应对海量的大应用; 第二点,系统整体的健壮性。 在此基础上整体这套东西非常简单就是为了实现敏捷开发,以此降低各种各样的成本。

金字塔最上层的业务互动,大家对数据最基本的认识就是看、读、用、懂。 看数据处在工作的刚需层面,在此基础上,真正通过数据得到启发,来指导业务的话,可以进入第二阶段的读数据,再往上一层是用数据,在数据中找到洞察,从而指导我们的工作。 最上层是比较经典的业务模型,在此基础上去设计业务和系统。

640?wx_fmt=jpeg

在爱奇艺内部,目前在我们实现半自动埋点,并不是说我们不能实现全自动(全埋点),我个人认为这对于一个有很多诉求的大场景来说,是会有很多冗余数据,所以我们是半自动。 在此基础上,整体的BI应用、AI应用,各种各样的留存分析、报表,即是我们整个业务增长体系的所有东西。

640?wx_fmt=jpeg

从懂到用: 降低时间、操作门槛。 在爱奇艺内部我们有一个文化,我们所有数据相关的业务部门和大数据部门定期都有业务数据分析的分享会。

640?wx_fmt=jpeg

最后总结一下, “大中台、小前端”,而且我们是在娱乐大数据领域拥有非常专、非常深的应用。

爱奇艺的大数据中台战略使以用户为核心的持续的规模化业务创新成为可能,业务响应能和规模化创新能力,是互联时代企业综合竞争的核心体现。 正是因为拥有这种核心竞争力,爱奇艺才能利用好自己的娱乐大数据,在泛娱乐领域遍地开花,以一系列创新业务来领跑行业!


本文转载自 IT168

end

也许你还想看

640?wx_fmt=gif   
扫一扫下方二维码,更多精彩内容陪伴你!

640?wx_fmt=png