python比赛评分计算_用Python完成PSM（倾向性匹配评分）算法详解

weixin_39606048

于 2020-12-29 13:23:43 发布

阅读量2.5k

点赞数

文章标签： python比赛评分计算

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39606048/article/details/112029489

版权

本文介绍了如何使用Python进行PSM（倾向性评分匹配）算法，这是一种在无法进行实验的情况下评估措施效果的方法。通过数据预处理、建立逻辑回归方程和匹配实验组与对照组，展示了在非实验数据上应用PSM的步骤。

摘要由CSDN通过智能技术生成

PSM是什么？什么时候会用到PSM？

PSM(Propensity Score Matching)倾向性评分匹配，是使用非实验数据或观测数据进行干预效应分析的一类统计方法。

为了研究某项措施或是某个行为对人群的影响(例如吸烟对健康的影响，读北大对收入的影响)，或者互联网中某项措施对于用户的影响，最直接有效的评估方法是我们从大量的样本中随机选择对照组(control group)和实验组(treated group)，保证这些用户在实验前的一致性(通过aa test)，然后进行AB test，之后来评估效果。

而在现实中，由于一些因素，并不能有效的开展上述实验，例如不能强迫可以上北大的人不上北大吧，以及组织实验者来吸烟吧。在这种情况下，我们期望能够引入一种方法来找到有效的对照组，以此来评估该项措施的效果。(具体PSM的假设原理和合理性在此不作过多的讨论)

结合Python将具体介绍PSM的实现方式(本文介绍的Python实现方式基于Python 3.X)

数据预处理

引用包import warnings

warnings.filterwarnings('ignore')

import pandas as pd

import numpy as np

%matplotlib inline

import os

from scipy import stats

import matplotlib.pyplot as plt

import patsy

import sys

from statsmodels.genmod.generalized_linear_model import GLM

最低0.47元/天解锁文章

weixin_39606048

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。