基于PSM-DID的营销场景因果建模分析

本文以营销场景为例,介绍了如何使用PSM(倾向性匹配)和DID(差异-in-differences)方法评估优惠券对用户消费额的提升效应。通过Python的sklearn和statsmodels库计算倾向得分、进行匹配和回归拟合,结果显示优惠券能显著提升消费额。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


前言

本文主要衔接上文继续补坑,补充一个简单的数据集用于讲解psm-did方法在数据场景下建模过程实现,希望可以帮助大家进一步理解PSM-DID方法,不足之处,望多多指正。

(1)背景介绍

  • 业务问题:这里以营销场景中优惠劵对用户前后消费额提升问题为例,通过PSM-DID方法对优惠券对用户消费额提升效应进行评估。
  • **实现方法:**这里通过python sklearn库实现倾向性得分的计算与匹配部分、statsmodels实现DID中回归拟合部分调用库包方法如下:
    image.png
  • 数据介绍:将想x1作为用户年龄(18-80),x2作为用户收入水平(1、2、3、4),x3作为用户性别(0:女性,1:男性),d作为处理变量(0表示用户未使用优惠劵,1表示用户使用了优惠劵)y0为结果变量表示在t=0发券前的消费额、y1为结果变量表示在t=1发券后的消费额,数据生成代码如下:
    image.png

(2)PSM倾向性匹配

  • 倾向得分计算:将用户年龄、收入水平、性别作为自变量、用户是否使用优惠劵作为因变量,计算倾向得分,代码如下:
    image.png
  • 倾向性匹配:通过最近邻匹配等到每个处理组对应匹配得到的控制组,代码如下:
    image.png
    将处理组与匹配到的控制组对应y1、pscore合并得到对应y2、pscore1用于下一步的DID步操作

(3)DID因果效应评估

  • 最小二乘拟合:Y1=Y2+a2d,实现代码如下a2d为使用优惠券对消费额的提升效应,实现代码如下:
    image.png
  • 回归方程残差分布观察:
    image.png
  • 拟合结果打印
    image.png
  • 因果效果评估:模型效果:模型拟合优度(R-squared)为 0.964,拟合效果较好,通过绘制残差分布图不难得到残差的正态结论,因果效应:其中自变量d的系数为0.7881,说明其他因素不变的情况,使用优惠券的行为可以提升用户0.7881单位的消费额,可以认为本次使用消费券对用户消费额有正向的提升作用。

写在后面

PSM-DID是一种反事实因果推断的有效方法,需要注意本文数据集旨在帮助读者理解PSM-DID建模应用,中间的数据处理、异常值处理、平行趋势检验等都通过数据简单化的处理未做展现,需要读者自己在的业务中根据自己的业务数据情况,灵活实践运用,让PSM-DID成为解决业务问题的利器,产生实际的业务价值。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

胸中有数-数分版

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值