python比赛评分计算_用Python完成PSM(倾向性匹配评分)算法详解

本文介绍了如何使用Python进行PSM(倾向性评分匹配)算法,这是一种在无法进行实验的情况下评估措施效果的方法。通过数据预处理、建立逻辑回归方程和匹配实验组与对照组,展示了在非实验数据上应用PSM的步骤。
摘要由CSDN通过智能技术生成

PSM是什么?什么时候会用到PSM?

PSM(Propensity Score Matching)倾向性评分匹配,是使用非实验数据或观测数据进行干预效应分析的一类统计方法。

为了研究某项措施或是某个行为对人群的影响(例如吸烟对健康的影响,读北大对收入的影响),或者互联网中某项措施对于用户的影响,最直接有效的评估方法是我们从大量的样本中随机选择对照组(control group)和实验组(treated group),保证这些用户在实验前的一致性(通过aa test),然后进行AB test,之后来评估效果。

而在现实中,由于一些因素,并不能有效的开展上述实验,例如不能强迫可以上北大的人不上北大吧,以及组织实验者来吸烟吧。在这种情况下,我们期望能够引入一种方法来找到有效的对照组,以此来评估该项措施的效果。(具体PSM的假设原理和合理性在此不作过多的讨论)

结合Python将具体介绍PSM的实现方式(本文介绍的Python实现方式基于Python 3.X)

数据预处理

引用包import warnings

warnings.filterwarnings('ignore')

import pandas as pd

import numpy as np

%matplotlib inline

import os

from scipy import stats

import matplotlib.pyplot as plt

import patsy

import sys

from statsmodels.genmod.generalized_linear_model import GLM

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值