一、有点道道的归因
1、马尔可夫归因
马尔可夫归因的主要思想是移除效应:对于一个因子,有我参与的结果和没有我参与的结果的差别,也就是边际增益或边际效应。举个不新鲜的例子:
对于C1,有C1参与时,有两条转化路径:start-C1-C2-C3-conv,以及start-C2-C3-conv。所以
P(conv|有C1) = P(start-C1-C2-C3-conv) +P(start-C2-C3-conv)
=0.667*0.5*1*0.5 + 0.33*1*0.5 = 0.33
没有C1参与时,有一条转化路径:start-C2-C3-conv。所以
P(conv|没有C1) =P(start-C2-C3-conv)
=0.33*1*0.5 = 0.167
所以C1的移除效应为:1-P(conv|没有C1)/P(conv|有C1) = 1-0.167/0.33 = 0.5。
同理计算C2的移除效应为:1,C3的移除效应为:1。
最后得C1的贡献值为0.5/(0.5+1+1) = 0.2,C2的贡献值为1/(0.5+1+1) = 0.4,C3的贡献值为1/(0.5+1+1) = 0.4。
马尔可夫归因要求能够画出转化路径图(有向无环图)。
2、Shapley Value 夏普利值
Shapley Value的主要思想也是边际贡献,但它依靠的不是转化路径图,而是各种因子组合的效应。直接上公式吧(别打头,后面的例子就说明白了):
2.1举个不新鲜的例子(考虑组合内部因子的先后顺序):
由于考虑的顺序,所以各个联盟出现的概率相同,权重也就相同,所以就没考虑权重项。
2.2 再举个不新鲜的例子(不考虑组合内部因子的先后顺序):
甲、乙、丙三人合作经商。倘若甲、乙合作可获利7万元,甲、丙合作可获利5万元,乙、丙合作可获利4万元,三人合作则获利11万元,每人单干各获利1万元。
问三人合作时,如何分配获利?
以计算甲的 Shapley Value为例:
包含联盟 | {甲} | {甲、乙} | {甲、丙} | {甲、乙、丙} |
v{s} | 1 | 7 | 5 | 11 |
v(s∖{i}) | 0 | 1 | 1 | 4 |
v(s)−v(s∖{i}) | 1 | 6 | 4 | 7 |
|s|联盟的个数 | 1 | 2 | 2 | 3 |
权重系数 | 0!2!/3!=2/6 | 1!1!/3!=1/6 | 1!1!/3!=1/6 | 2!0!/3!=2/6 |
2/6*1=0.33 | 1/6*6=1 | 1/6*4=0.66 | 2/6*7=2.33 |
所以甲的 Shapley Value等于:0.33+1+0.66+2.33=4.33
同理计算乙、丙的Shapley Value为3.83、2.83。
Shapley Value要求有每种联盟组合的贡献值作为计算输入。
3、Robyn
Robyn是 Facebook Marketing Science 的实验性、自动化和开源营销组合建模 (MMM) 代码。从模型公式中可以看出它是一个加法模型,主要包含S曲线、Prophet(节假日、季节、趋势)因子、其他因子(如促销活动等)等组件。其中S曲线主要考虑广告影响衰减、收益递减模式。
广告影响衰减反映了广告效果在初次曝光后会滞后和衰减的理论:并不是所有的广告效果都能立即感受到——记忆力会增强,人们有时会推迟行动——这种意识会随着时间的推移而减弱。
收益递减理论认为,每增加一个广告单位,响应就会增加,但速度会下降。
此外,Robyn还应用了很多计算技术,如带交叉验证的岭回归、用于超参数优化的多目标进化算法、用于预算分配的基于梯度的优化等。
Robyn的主要作用在于分解出各个组件,包括渠道曝光、渠道触达、节假日、季节、趋势以及其他因子对因变量(一般为收入或转化)的贡献度,进一步可以计算最优的渠道预算分配。
使用Robyn的要点是理解各个组件,恰当使用各个参数。
4、特征重要度
在机器学习模型中,特征的重要度在一定程度上也可以理解为归因分析,越重要的特征贡献越大嘛。特征重要度的分析方法有
4.1 树模型直接输出特征重要度(根据增益或分裂次数)
4.2 线性模型的系数
4.3 Permutation Importance。将特征随机重排后,模型表现评分的下降程度。
4.4 删除特征,模型表现评分的下降程度。
4.5 SHAP,可以量化每个特征对预测的贡献程度,但复杂度很高不具备实用价值。
二、简单粗暴的归因
1、首次触点归因
2、末次触点归因
3、线性归因
4、位置归因
5、时间衰减归因
不详细说了,资料很多。
三、规整的归因
因果图、结构方程模型等。考虑混杂、因果结构、do算子、后门准则、前门准则、工具变量等因果概念的方法。
为什么:关于因果关系的新科学 The Book of Why.pdf
链接:https://pan.baidu.com/s/1Z-gp0xLLj9Ia0z_atCJSjQ
参考博客:
https://blog.csdn.net/weixin_43578061/article/details/131500280
夏普利值:看诺奖获得者提出的广告效果归因分析新思路-鸟哥笔记
Robyn MMM2.0 - Facebook Marketing Science(R)市场营销-广告投放_robyn包 安装-CSDN博客