原文题目:Propensity Modeling, Causal Inference, and Discovering Drivers of Growth
作者:Edwin Chen
翻译:张逸
校对:卢苗苗
本文共5400字,建议阅读9分钟。
本文通过举例为你介绍因果推测方法、倾向建模及增长的驱动因素。
在正文之前,先想象这样一个场景。
你刚开始一份新工作,而且最近看了《僵尸世界大战》这部电影,正处于一种怀疑人生的状态。再加上前不久你的两个初创公司因为缺乏数据开不下去了,所以你看什么都不太顺眼。
你最先开始考虑销售团队的影响。他们到底为公司带来了多少额外的收入?你遇见的销售人员们说他们推销的客户有90%都买了公司的产品,但你还是心存疑问:这些客户中,到底有多少是因为销售员的功劳才决定购买的?
所以你查看了工作日志,并且注意到一些有意思的事儿:上个星期是hack week,一半的销售员都因为要打电话收集资料而腾不出空来,然而这一周客户的转化率却没有发生变化。
正在百思不得其解的时候,一个同事走到桌边来。他拿了一提Soylent饮料,想让你尝尝。这个饮料看起来不怎么样,所以你问同事它好在哪,同事说他朋友喝了这个饮料几个月以后就能跑马拉松了。所以呢?他们刚开始跑吗?--当然不是,人家去年就能跑马拉松了!
Causal Inference(因果推断)
事物之间的因果关系毫无疑问是很重要的,但难点就在于如何确定这种关系。
考虑以下几个问题:
某个病人吃了一种新药以后身体情况有所好转,这种好转是因为药物的作用还是本来他的身体就在恢复?
是你的销售团队确实起到了作用,还是他们仅仅是向那些本来就要购买商品的客户进行了推销?
喝Soylent饮料(或者你公司的巨额广告投入)值得吗?
在理想世界中,只要我们乐意,就可以做实验来验证---实验才是检验因果关系的最好标准。但现实情况是我们不能这样做。就拿刚才那些例子来说,你不能让病人服用安慰剂或者未经测试的药品,这是有违道德的。而且公司经理们恐怕不会愿意为了潜在的短期收益把精力放在随机的客户上。同理,那些靠销售额领取奖金的销售团队也会反对这样做。
那么我们应该如何在没有A/B测试的情况下理解因果关系?这就是propensity modeling(倾向建模)和其他因果推断技术发挥作用的地方。
Propensity Modeling(倾向建模)
继续Soylent饮料的例子,我们用倾向建模的技术来分析喝soylent饮料到底有什么作用。为了解释清楚这个概念,接下来要开始一场思想实验。
假定Brad Pitt有一个双胞胎的哥哥,兄弟俩哪都一样:Brad1和Brad2一起起床,吃一样的事物,进行同样强度的体能锻炼等等。有一天,Brad 1 碰巧从街上的促销员那里得到了最后一打Soylent饮料,但Brad 2没有这样的好运气。所以Soylent只出现在了Brad1的食谱上。在这种情况下,可以认为,双胞胎