python 分类变量回归_分类变量回归——Probit和Logit（附代码）

最新推荐文章于 2024-06-02 10:40:51 发布

weixin_39811386

最新推荐文章于 2024-06-02 10:40:51 发布

阅读量2.4k

点赞数

文章标签： python 分类变量回归

为什么不是普通线性回归？

使用普通线性回归技术，我们必须确保回归技术对于研究问题的适用性，才能相信回归结果是可靠的。识别回归技术的适用性，我们需要对回归分析进行诊断，诊断内容是线性回归最基本的六个假设是否成立，即

误差项是一个期望为0的随机变量；

对于解释变量的所有观测值，随机误差项有相同的方差；

随机误差项彼此不相关；

解释变量是确定性变量，不是随机变量，与随机误差项彼此之间相互独立；

解释变量之间不存在精确的(完全的)线性关系，即解释变量的样本观测值矩阵是满秩矩阵；

随机误差项服从正态分布。

那么，当我们遇到被解释变量为分类变量这一特殊的情境时，如果能够使用普通线性回归技术，就必须要满足以上所提到的六个基本假设，我们来进行一个简单的模拟。

我使用一个火箭发射成功与否的数据集来进行接下来的测试，首先我们读取数据集。

import numpy as np

import pandas as pd

data = pd.read_csv("challenger.csv")

data.drop(columns=['Unnamed: 0'], inplace=True)

数据集如下：

num_at_riskdistresslaunch_templeak_check_pressureorder

06170502

16069503

26068504

36067505

46072506

560731007

660701008

761572009

8616320010

9617020011

10607820012

11606720013

13606720015

14607520016

15607020017

16608120018

17607620019

18607920020

19607520021

20607620022

21615820023

我们使用statsmodels提供的线性回归分析API来完成回归，然后进行简单的可视化

import statsmodels.formula.api as smf

model = sm

最低0.47元/天解锁文章

weixin_39811386

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
python 分类变量回归_分类变量回归——Probit和Logit（附代码）

为什么不是普通线性回归？使用普通线性回归技术，我们必须确保回归技术对于研究问题的适用性，才能相信回归结果是可靠的。识别回归技术的适用性，我们需要对回归分析进行诊断，诊断内容是线性回归最基本的六个假设是否成立，即误差项是一个期望为0的随机变量；对于解释变量的所有观测值，随机误差项有相同的方差；随机误差项彼此不相关；解释变量是确定性变量，不是随机变量，与随机误差项彼此之间相互独立；解释变量之间不存在精...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。