广义线性模型_广义线性模型(GLM)从人话到鬼话连篇

广义线性模型(GLM)是一组包括逻辑回归、泊松回归的统计模型,克服了普通线性模型对数据的限制。GLM由线性预测、随机性和联系函数三要素构成。线性预测涉及自变量的线性组合对模型预测的贡献;随机性则关注因变量的不确定性,通常通过概率分布来描述;联系函数将线性预测与因变量的实际值关联起来。GLM适用于处理非正态分布或非连续的因变量,如二项分布、泊松分布等。
摘要由CSDN通过智能技术生成

作为一个应用者来说,要了解一个模型的顺序是:1)为什么要用这个模型解决问题?2)这个模型是什么,可以解决什么问题?3)模型怎么用?4)应用领域是什么?解决了哪些问题?5)模型的归档与应用划分?

人话篇:广义线性模型到由来

从逻辑回归模型开始,我们连续讲了好多集有些相似又特点各异的几种统计模型。它们有个统一的旗号,叫做「广义线性模型」(generalized linear model)。许多在大学里学过一点统计的读者,可能对广义线性模型还是会感到比较陌生。为什么这些模型能被归为一个大类?它们的共同点在哪里?今天我们就和大家一块用说人话的方式再来系统地认识一下,广义线性模型到底是何方神圣。

在耐着性子把这篇文章读完之前,大家肯定会想,为什么要学习广义线性模型呢?毕竟光是理解线性模型的各种用法就已经够头疼的了,再加个广义更绕不清楚了。

普通线性模型对数据有着诸多限制,真实数据并不总能满足。而广义线性模型正是克服了很多普通线性模型的限制。在笔者的心里,广义模型能解决的问题种类比普通线性模型多很多,用图来表示,大概就是这样的:

b3e0b749826c5661a5d41f28799742f6.png

图一:定性对比广义线性模型和普通线性模型的能解决的问题多少

我们将要回到广义线性模型的本质,从广义线性模型的

三个要素——

  • 线性预测

  • 随机性

  • 联系函数

入手,在理论层面系统深入地了解广义线性模型。

  1. 线性预测

  • 各路线性模型的共同点:线性预测

不管是普通线性模型,还是广义线性模型,既然打着「线性模型」旗号,总该是有个原因的吧?这里的「线性」指的是多个自变量的「线性组合」对模型预测产生贡献,也叫做线性预测,它具有类似于下面的形式:

首先这个类似与我们线性代数里的线性系统,看看我的总结:

1838edb1b79bf0122ba871a584785b16.png

4a7e26004a80ebefbafb0675d89ad662.png

这个形式读者们已经非常熟悉了,因为之前讲的所有模型使用的都是线性预测。

统计模型中的β0、β1、β2等是模型的参数,如果把模型看成是一个音箱,这些参数就像看是音箱上一个个控制声音的旋钮。为啥音箱得要怎么多旋钮呢?因为虽然拧每一个旋钮达到的效果不同,可能β0管的是低音炮部分,β1管的是中音区,β2管的是高音区,模型里面需要这么多参数也是为了控制各种自变量对因变量的影响的。

  • 为什么各种常用的模型都选择线性预测呢?

当我们调节某一个旋钮的时候,我们当然希望声音的效果与旋钮拧了多少成正比,如果拧了一圈声音跟蚊子叫一样,而拧了两圈声音突然震耳欲聋,这样的音箱用起来就得经过反反复复地调节才能找到最佳音量,非常的不方便。统计模型的在寻找最优参数的时候做得就是调节音量这件事,使用线性预测使得β0、β1、β2这些参数改变的值与预测的结果的改变值成正比,这样才能有效地找到最佳参数。

2. 随机性— 统计模型的灵魂

  • 我们之所以会建立统计模型,是想研究自变量(

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值