回归方程的拟合优度检验_属性数据分析 | 第三章-04-统计推断与模型检验

本文介绍了在广义线性模型(GLM)中,如何通过偏差(deviance)进行模型拟合优度检验,并探讨了标准差(SE)与残差(Residuals)在评估模型中的作用。偏差是衡量模型拟合优度的重要指标,而残差则用于分析模型在个体样本上的拟合情况。通过似然比检验和Wald统计量,我们可以对模型进行推断。此外,文章还提到了不同类型的残差,如偏差残差、皮尔逊残差和标准化残差,这些工具帮助我们诊断模型的不足之处。
摘要由CSDN通过智能技术生成

bd7d9e52b622c63428dcd49548deae28.png

这一节将介绍deviance这个概念,概述具有普适性的推断方法。GLM的模型拟合用的是Newton-Raphson算法,由于R包可以直接给结果,我们就不去追究这个算法的详细过程了。

在进入正式的笔记之前,我们先说两个记号:

对于观察量

的特定的GLM,记
为关于
的对数似然函数,这个函数是我们感兴趣的东西。我们通过求解似然函数估计得到
的极大似然估计
,回代得到我们模型的极大似然估计,取对数记为

634f5cf97df02397eec1d22affa39a4f.png
例如上图的打鼾与心脏病。我们为打鼾与心脏病设计了线性概率模型,通过对打鼾程度赋分,来判断是否得心脏病。打鼾程度一共有“从不”、“偶尔”、“几乎每晚”、“每晚”四档,
表示打鼾程度的得分,取值为
。不同打鼾程度患心脏病与否的样本量为分别为
,前者为患心脏病的人数
,后者为不患心脏病的人数。我们的模型认为
表示得心脏病的概率,
。那么对于每一个不同的程度
。在二项分布假设下,我们的似然函数为
。得到MLE后,我们将
代入得到
,从而得到
。整个过程中我们一共设计了两个参数:

另外,我们可以对每一个样本都设计对应的参数弄出一个尽可能的最复杂的模型,同样得到极大似然估计后回代取对数,得到

——这里的
  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值