![bd7d9e52b622c63428dcd49548deae28.png](https://i-blog.csdnimg.cn/blog_migrate/3f2083f1ff980986c4da0f9d585e222b.jpeg)
这一节将介绍deviance这个概念,概述具有普适性的推断方法。GLM的模型拟合用的是Newton-Raphson算法,由于R包可以直接给结果,我们就不去追究这个算法的详细过程了。
在进入正式的笔记之前,我们先说两个记号:
对于观察量
![634f5cf97df02397eec1d22affa39a4f.png](https://i-blog.csdnimg.cn/blog_migrate/b29644f40057e806ec4cdc37981cd41d.png)
例如上图的打鼾与心脏病。我们为打鼾与心脏病设计了线性概率模型,通过对打鼾程度赋分,来判断是否得心脏病。打鼾程度一共有“从不”、“偶尔”、“几乎每晚”、“每晚”四档,表示打鼾程度的得分,取值为
。不同打鼾程度患心脏病与否的样本量为分别为
,前者为患心脏病的人数
,后者为不患心脏病的人数。我们的模型认为
表示得心脏病的概率,
。那么对于每一个不同的程度
,
。在二项分布假设下,我们的似然函数为
。得到MLE后,我们将
代入得到
,从而得到
。整个过程中我们一共设计了两个参数:
。
另外,我们可以对每一个样本都设计对应的参数弄出一个尽可能的最复杂的模型,同样得到极大似然估计后回代取对数,得到