聊一聊数据洞察

聊一聊数据洞察

|0x00 数据洞察是什么

最近有一个词谈的非常多:“数据洞察”,在大数据时代,数据是业务增长的基础,就像石油一样,如果不掌握核心数据,就缺少了核心的资源。但掌握了核心数据,不掌握提炼数据的能力,就像石油无法精炼,即便坐拥丰厚的资源,同样无法构筑商业壁垒。况且,资源总有耗尽的一天,而数据总有失去价值的时刻。

因此,数据洞察被提了出来,希望通过这种方式,来实现对数据的“精加工”。

从数据中提取价值,首先就要搞清楚数据分析与数据洞察的区别。其实,在日常的工作中,绝大多数人与数据打交道的方式,就是通过分析产生的。数据是没有经过处理的信息,在大数据至热的年代里,有了数据还远远不够,我们还要懂得如何让数据告诉我们信息,懂得如何从信息中心总结出知识。数据分析是从这些信息中心发现特定的规律与趋势,并整理成报告或者报表。而数据洞察,则是在数据分析的基础上,提炼出有价值的内容,比如运营决策、机会预测、异动原因等。

很多人会认为我产出了分析报告或者报表就可以了,但这就好像是以为自己看了几个报表,就可以指点商业的江山。我们切不可把要面对的世界简单化。数据洞察承认了商业的复杂性,并通过一些已知的方式,来诊断复杂性产生的前因、现状与后果。

用更直白的话讲,数据洞察是一种“套路”,更是一种“思维方式”。

|0x01 数据洞察的基本套路

数据洞察一般来讲,套路上有四个基本的部分,分别是:描述、诊断、预测与决策。

  • 描述:描述的意义,在于客观反映业务的现状。数据洞察并不会放弃基本的报表统计,相反会积极补全缺失的统计维度。业务要看自己如何发展的好不好,首先就要看这些描述性的统计数据。如果业务是一个漏洞模型,那么漏斗上的每个节点都要体现在我们的描述数据里,并且能够从汇总性的指标一路下钻,直到看清楚最明细的数据。

  • 诊断:描述性的数据不会是一条直线,而是会有非常多异常的点,比如今天收入突然下降了10%,那么是因为遇到了节假日?还是广告主投放计划变化?甚至是数据算错了?这时候需要一些更深入的统计,例如单指标多维度拆解,或者是多指标相关贡献度拆解,让分析师或者运营,快速发现因为哪些指标异常,引起了业务指标波动;

  • 预测:基于历史趋势的变化,算法同学是能够预测未来某个时间点,发生某件事情的概率。例如预测双十一那天某件单品的销量。这样运营同学就能够有针对性的进行资源倾斜的分配,提升业务效率;

  • 决策:通常情况下业务作出一个决策,是需要经过线下的沟通,那么数据同学如果能跳出技术的范畴,主动与业务同学合作,在某些特定的场景下,将决策选择数据化,那么数据的预测结果就可以直接决定某些决策,对于运营效率及结果准确性的提升,效果非常显著。

|0x02 团队如何实现数据洞察目标

尽管数据洞察的能力是每个数据团队追求的目标,但事情的发展不会是一帆风顺,总会有风风雨雨,那么我们应该在不同的阶段,应该聚焦于团队的建设能力呢?

第一个阶段,是完善自助分析工具。例如数据的产出时间,是T-1能够产出,还是H-1能够产出,甚至是实时就可以产出。当数据产出后,业务方有什么手段,能够自己去搭建分析报表。当有了搭建报表的工具,我们有什么方法,能够保证大家产出的数据是一致的,我们有没有成熟的指标体系给到业务方。分析工具能力是一个数据团队的内功,建设周期很长,但它很有用。

第二个阶段,是引入算法分析能力。但这个能力并不是招几个算法同学就完事了,或者是自己产出一些结果就可以了。算法分析,首先要有明确的业务场景,有了场景才有可能将预测的结果应用落地。这个阶段,很多团队往往会遇到一个需求,就做一个需求,而缺少通用能力的沉淀。什么是通用能力的沉淀,就是能够将一些成熟的分析方法,通过工业化的方式落地,例如如何降低A/B Test的使用门槛,如何批量给一个用户打标签,业务结果有没有反正的反馈链路,等等。

第三个阶段,是构建数据洞察中台。中台并不是指把所有数据都集合到一起完事了。而是基于长期的业务分析经验,能够将通用场景做成模块化的方式,将过往的有效解决方案关联到这些模块上,提供自定义配置的能力,供业务方选择。这个阶段,中台的能力往往不是具象的,而是抽象的。有了抽象的能力,一些新的业务想要接入的时候,只需要将抽象的概念打平,就能够迅速借鉴已有的能力,复制出新的应用场景,实现业务的倍增。

|0xFF 从数据洞察到数据科学

数据科学与数据洞察的区别是什么?数据科学,其概念本身最为广泛,包含了整个“数据”相关的科学与实践。与数据洞察不同的是,数据科学偏向于分析“宏观”问题,而数据洞察偏向于分析特定行业或具体问题的挑战。数据科学最重要的方法在于,通过“自动化”对数据的分析,充分利用各类“工具”,来理解事物之间的真正本质。

人类的学习是一个人根据过往的经验,对一类问题形成某种认识或总结出一定的规律,然后利用这些知识来对新的问题下判断的过程。数据科学,或者是机器学习,它们初始的设计思想并不复杂,仅仅是对人类学习过程的一个模拟,让机器能够像人一样进行思考。而在这整个过程中,最关键的是数据。

数据科学是一定是跨学科的,就像数据洞察一定是跨岗位的,有了更远大的目标,当下的发展才会更有动力,信念的力量是不可磨灭的。

©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页