广义线性模型

Julio_胡

于 2017-02-26 12:42:37 发布

阅读量1.5k

点赞数

分类专栏：概率论与数理统计文章标签：概率论与数理统计

本文链接：https://blog.csdn.net/touristman5/article/details/57408797

版权

概率论与数理统计专栏收录该内容

7 篇文章 1 订阅

订阅专栏

广义线性模型(Generalized Linear Model)

本文沿接接着上节的指数分布族,文章中注了引入指数分布族的概念是为了说明广义线性模型。

概念

广义线性模型（generalized linear model, GLM)是简单最小二乘回归（OLS)的扩展,在广义线性模式中，假设每个变量的观测值 Y来自某个指数族分布。该分布的平均数 $\mu$ 可由与该点独立的X解释：
$E(y)=\mu=g(\theta^Tx)$
其中E(y)为y的期望值， $\theta^T x$ 是由未知待估计参数 $\theta$ 与已知变数X构成的线性估计式，g则为链接函数。
在此模式下,y的方差V可表示为：
$Var(y)=V(y)=V(g(\theta ^Tx))$
一般假设V可视为一指数族随机变数的函数。
未知参数 $\theta$ 通常会以最大似然、贝叶斯方法估计。

例证

这里写图片描述

参考此例： $\eta$ 与伯努利分布中的参数 $\varphi$ 的关系是Logistic函数，再通过推导可以得到Logistic回归。见下文推导示例。

通过此例，我们可以推想， $\eta$ 以不同的映射函数与其他概率分布函数中的参数发生联系，从而得到不同的模型，广义线性模型正是将指数族分布中的所有成员都作为线性模型的扩展，通过非线性的连接函数映射到其他空间从而大大扩大了线性模型可解决的问题。

假设条件

下面我们看看GLM的形式话定义，GLM的三个假设：
1） $y|x;\theta～ExpFamily(\eta)$ ：给定样本x与参数 $\theta$ ,样本分类y服从指数分布族中的某个分布
2）给定一个x，我们需要的目标函数为 $h_\theta(x)=E\left[ T(y)|x\right]$
3） $\eta=\theta^Tx$