本文来自阅读书籍《精益数据分析》的学习笔记,加上自己的一些理解,整理出来的思路。
精益数据分析的周期:
上面这张图概括了书籍第二章的内容。
精益数据分析的核心,即上图的这整个周期:
1. 确定一个好的数据指标;
这个指标是根据所面对的问题或者业务来确定的。对于企业来说,就是推动公司业绩增长的指标,即关键绩效指标(KPI)。
书中说,一个好的数据指标,应当是比较性的、简单易懂的,通常情况下是一个比率。
有五种指标的分类,或者说是评估指标的参考:
- 定性指标、定量指标
定性,即”好、坏、一般般“,形容词;定量,即”1000万、增加120%“,带具体数值。
- 虚荣指标、可付诸行动的指标
虚荣指标,即好看但没太大用,比如访问量、注册会员数等,大概率只会随着时间增长,对业务改进没太大用;
可付诸行动的指标则相对。
- 探索性指标、报告性指标
探索性指标,即挖掘一些潜在的我们还不知道的影响因子,得到的一些我们没得到过的指标;
报告性指标,即跟随公司日常战略,持续关注的明面上的指标。
- 先见性指标、后见性指标
先见性指标,即预测未来,加以防范;
后见性指标,即已遭此劫,亡羊补牢。
- 相关性指标、因果性指标
相关性指标,即有联系,但不一定是因果,比如因为进入夏天,冰淇淋销量和溺亡人数都上升,但并不是因为冰淇淋销售导致溺亡,他们相关但不是因果;
因果性指标,即因指标导致了果指标,这可能是多对一的,多个因导致一个果。
2. 在确定需要关注的指标后,公司要找到影响这个指标的因子,分析的方法在书里叫做测试。
测试就是通过以下四个板块,来比较和分析两个样本的不同:
- 市场细分
就是通过数据挖掘,发现用户的共同特征,针对特征进行业务的改进。
- A/B测试(横向对比)
市场细分就比较玄学,全靠想象的感觉,而AB test就做实事。
假设其他条件保持不变,仅考虑体验中的某一属性(如链接 的颜色)对被试用户的影响,就是 A/B 测试。
A/B测试有个软肋,就是需要逐一对比,得到单一因素的效果。对于大型网站来说,用户多,可以迅速得到答案;小网站得到足量的反馈就比较慢。
如果版本的改动比较大,那么就比较费时。
- 同期性分析(纵向对比)
应该把用户按照使用产品的时间进行分类,意思就是,从发布就开始玩这款游戏的玩家,和刚入坑的玩家,他们的想法和体验是不同的,因此需要分开分析。
- 多变量测试
进行一连串的单独测试会延长你走向成熟的周期。
多变量测试,原理为,用统计学方法剥离出单个影响因子与结果中某一项指标提升的相关性。(比如线性回归模型的系数的p-value?)