java概率回归_Logistic回归statsmodels的概率预测置信区间

本文通过示例展示了如何利用delta方法和bootstrap技术来计算Logistic回归模型预测概率的置信区间。通过Python的statsmodels库,我们首先构建Logistic回归模型,然后计算预测概率的导数和系数协方差,以此得出概率的方差。接着,通过绘图对比delta方法和bootstrap方法的结果,揭示两者在有限样本中可能出现的差异。
摘要由CSDN通过智能技术生成

您可以使用delta method查找预测概率的近似方差 . 也就是说,

var(proba) = np.dot(np.dot(gradient.T, cov), gradient)

其中 gradient 是模型系数的预测概率导数的向量, cov 是系数的协方差矩阵 .

事实证明,Delta方法可以渐近地用于所有最大似然估计 . 但是,如果您有一个小的训练样本,渐近方法可能无法正常工作,您应该考虑自举 .

以下是将delta方法应用于逻辑回归的玩具示例:

import numpy as np

import statsmodels.api as sm

import matplotlib.pyplot as plt

# generate data

np.random.seed(1)

x = np.arange(100)

y = (x * 0.5 + np.random.normal(size=100,scale=10)>30)

# estimate the model

X = sm.add_constant(x)

model = sm.Logit(y, X).fit()

proba = model.predict(X) # predicted probability

# estimate confidence interval for predicted probabilities

cov = model.cov_params()

gradient = (proba * (1 - proba) * X.T).T # matrix of gradients for each observatio

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值