PSM倾向得分匹配法【python实操篇】

最新推荐文章于 2025-04-20 07:01:46 发布

置顶

水满船头滑

最新推荐文章于 2025-04-20 07:01:46 发布

阅读量1.1w

点赞数 22

文章标签： python 算法理解

本文链接：https://blog.csdn.net/weixin_42847656/article/details/122355421

版权

本文是关于PSM倾向得分匹配法的Python实操教程，详细讲解了从数据集创建到匹配过程，包括数据介绍、完整代码示例和结果检验。作者提供了保姆级注释的代码，便于读者理解和复用。文中使用了虚构的电商场景数据，通过匹配得分进行干预组和对照组的匹配，并探讨了匹配规则和匹配效果。最后，作者分享了匹配结果的检验标准和资源获取方式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

大家好，我是顾先生，PSM倾向性得分匹配法的Python代码实操终于来啦！

对于PSM原理不太熟悉的同学可以看看前一篇文章：PSM倾向得分匹配法【上篇：理论篇】

目前网上PSM实操的相关文章都是R语言、SPSS和STATA实现的，少数Python版本代码不全，可读性有限（有些甚至要钱。。。）

所以我想出一版可读性强、能迅速复用的Python版本PSM，让各位同学既能看懂又能快速上手。

本次Python代码实操主要参考了psmatching的源码，并做了一定的修改，地址在文末参考资料。

这次我把每段代码都做了保姆级的注释，相信每位同学都能理解到位，当然肯定有注释不对的地方，也欢迎后台私信我。

本文的代码和数据集可关注我的公众号“顾先生聊数据”，后台发送“psm”后领取~

数据集介绍

为了更好地进行演示，我现编了一个数据集，该数据集以电商场景为基础，判断给用户发送优惠券PUSH是否会影响到用户。
在这里插入图片描述

数据集的类别主要由事实层标签（年龄、性别等）和行为层标签（最近一次购买diff、之前使用优惠券情况等）。

重申一下！数据集是我randbetween现编的，不用太较真具体内容。

完整代码

下面的代码我做了尽可能详细的注释，复用时需要修改的地方我也做了标注，如有不合理的地方欢迎后台私聊我哦~

安装psmatching包。

!pip install psmatching

import psmatching.match as psm
import pytest
import pandas as pd
import numpy as np
from psmatching.utilities import *
import statsmodels.api as sm

path及model设置。

#地址
path = "./data/psm/psm_gxslsj_data.csv"
#model由干预项和其他类别标签组成，形式为"干预项~类别特征+列别特征。。。"
model = "PUSH ~ AGE + SEX + VIP_LEVEL + LASTDAY_BUY_DIFF + PREFER_TYPE + LOGTIME_PREFER + USE_COUPON_BEFORE + ACTIVE_LEVEL"
#想要几个匹配项，如k=3，那一个push=1的用户就会匹配三个push=0的近似用户
k = "3"
m = psm.PSMatch(path, model, k)

获得倾向性匹配得分。

df = pd.read_csv(path)
#将用户ID作为数据的新索引
df = df.set_index("ID")
print("\n计算倾向性匹配得分 ...", end = " ")
#利用逻辑回归框架计算倾向得分，即广义线性估计 + 二项式Binomial
glm_binom = sm.formula.glm(formula = model, data = df, family = sm.families.Binomial())
#拟合拟合给定family的广义线性模型
#https://www.w3cschool.cn/doc_statsmodels/statsmodels-generated-statsmodels-genmod-generalized_linear_model-glm-fit.html?lang=en
result = glm_binom.fit()
# 输出回归分析的摘要
# print(result.summary)
propensity_scores = result.fittedvalues
print("\n计算完成!")
#将倾向性匹配得分写入data
df["PROPENSITY"] = propensity_scores

最低0.47元/天解锁文章