基于PSM-DID的营销场景因果建模分析

胸中有数-数分版

于 2023-06-22 23:48:11 发布

阅读量1.5k

点赞数 6

分类专栏： # 因果分析方法文章标签： python 机器学习人工智能营销分析 psm-did 因果分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Zengmeng1998/article/details/131345664

版权

因果分析方法专栏收录该内容

7 篇文章

订阅专栏

本文以营销场景为例，介绍了如何使用PSM（倾向性匹配）和DID（差异-in-differences）方法评估优惠券对用户消费额的提升效应。通过Python的sklearn和statsmodels库计算倾向得分、进行匹配和回归拟合，结果显示优惠券能显著提升消费额。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

前言
写在后面

前言

本文主要衔接上文继续补坑，补充一个简单的数据集用于讲解psm-did方法在数据场景下建模过程实现，希望可以帮助大家进一步理解PSM-DID方法，不足之处，望多多指正。

（1）背景介绍

业务问题：这里以营销场景中优惠劵对用户前后消费额提升问题为例，通过PSM-DID方法对优惠券对用户消费额提升效应进行评估。
**实现方法：**这里通过python sklearn库实现倾向性得分的计算与匹配部分、statsmodels实现DID中回归拟合部分调用库包方法如下：
数据介绍：将想x1作为用户年龄（18-80），x2作为用户收入水平（1、2、3、4），x3作为用户性别（0：女性，1：男性），d作为处理变量（0表示用户未使用优惠劵，1表示用户使用了优惠劵）y0为结果变量表示在t=0发券前的消费额、y1为结果变量表示在t=1发券后的消费额，数据生成代码如下：

（2）PSM倾向性匹配

倾向得分计算：将用户年龄、收入水平、性别作为自变量、用户是否使用优惠劵作为因变量，计算倾向得分，代码如下：
倾向性匹配：通过最近邻匹配等到每个处理组对应匹配得到的控制组，代码如下：

将处理组与匹配到的控制组对应y1、pscore合并得到对应y2、pscore1用于下一步的DID步操作

（3）DID因果效应评估

最小二乘拟合：Y1=Y2+a2d,实现代码如下a2d为使用优惠券对消费额的提升效应，实现代码如下：
回归方程残差分布观察：
拟合结果打印
因果效果评估：模型效果：模型拟合优度（R-squared）为 0.964，拟合效果较好，通过绘制残差分布图不难得到残差的正态结论，因果效应：其中自变量d的系数为0.7881，说明其他因素不变的情况，使用优惠券的行为可以提升用户0.7881单位的消费额，可以认为本次使用消费券对用户消费额有正向的提升作用。

写在后面

PSM-DID是一种反事实因果推断的有效方法，需要注意本文数据集旨在帮助读者理解PSM-DID建模应用，中间的数据处理、异常值处理、平行趋势检验等都通过数据简单化的处理未做展现，需要读者自己在的业务中根据自己的业务数据情况，灵活实践运用，让PSM-DID成为解决业务问题的利器，产生实际的业务价值。

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

胸中有数-数分版 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。