机器学习笔记——4 广义线性模型的基本思想和各个常用的回归特例(附logistic模型的python实现)

最新推荐文章于 2024-06-20 09:41:02 发布

_Volcano

最新推荐文章于 2024-06-20 09:41:02 发布

阅读量1.5k

点赞数

分类专栏：机器学习笔记文章标签：机器学习人工智能广义线性模型统计学习数学

本文链接：https://blog.csdn.net/ZJC_BELIEF/article/details/89097055

版权

本文深入探讨了广义线性模型（GLM）的基本概念，包括“广义”和“线性”的含义，以及为何需要GLM。文章详细阐述了典则联系函数和响应函数的作用，并介绍了如何通过典则响应函数选择来适应不同的分布需求。通过实例，文章展示了如何在二项分布假设下应用logistic回归进行数据分类，并提供了python实现的梯度上升算法，实验证明该方法能有效达到较高的预测准确率。

摘要由CSDN通过智能技术生成

广义线性模型(Generalized Liner Model)的基本思想和各个常用的回归特例(附logistic模型的python实现)

为什么需要广义线性模型？“广义”和“线性”的含义是什么？

首先我们需要解释线性的重要性。线性之所以如此重要，其本质原因在于两方面：

线性形式相对是简单的，而且我们擅长处理线性问题，无论是在工程实现上还是在数学分析上。在线性的世界里，无论是对象本身的描述还是变换的描述，我们都有很好的工具和语言去运用和表述它们，诸如直线、超平面、向量、矩阵和行列式等等，对于线性的优化问题，也已有系统的理论和可行的求解算法。
很多非线性问题，可以通过转化为线性问题进行求解。在这里不得不提起人类智慧的伟大结晶之一——微积分。微积分可以说是利用线性形式处理非线性问题的经典范例。这里我们需要扯开谈一下微积分。
我们经常谈微积分的基本思想“以直代曲，极限求和”，前者是微分的思想，后者是积分的思想。在微分中，实际上我们关注的是找一个线性变换，将各个独立的自变量增量进行变换，用以近似因变量的增量。这个线性变换是一个确定的变换，它由非线性函数 $f$ 在某点 $x_0$ 处确定，需要满足一定的条件。微分和导数是围绕这个线性变换来定义的，导数指的是这个线性变换对应的矩阵，而微分指的是变换后的因变量近似量。而所谓积分，即是将因变量的各个微分求和，这里体现的是极限的思想。

在广义线性模型中，线性体现在，我们的参数 $\theta$ 和各个属性 $x_i$ 之间的结合是线性的形式，即 $\theta^T x$ ，直观地看，我们是在找一个方向 $\theta$ 对 $x$ 进行投影(严格上应该是做内积)。在广义线性模型的各个特例中，这一线性的结合形式是始终不变的。

现在我们讨论“广义”的含义。在简单线性模型中，我们假设标签值 $y$ 服从 $N(u,\sigma^2)$ 。从而自然假设输出的形式为 $h_\theta(x) = \theta^T x$ 。这一输出形式带来的问题是，输出的范围不受限制，例如上篇我们讲分类问题的时候，对于取1概率p的输出估计值显然需要落在 $[0, 1]$ 之间。因此广义的含义在于，输出的形式限制可以打开，为
$h_\theta(x) = g(\theta^T x)$ 这样通过适当选取映射 $g ()$ 就能达到范围限制。这里我们称映射 $g ()$ 为响应函数，称映射 $g^{-1}()$ 为联系函数。可以看到，简单线性模型选用的响应函数为恒等函数。

典则联系函数和典则响应函数(canonical link function)

响应函数的选择可以有多种，比如在上一篇的二分类问题中，对范围在 $[0, 1]$ 的概率p，我们可以选择logistic函数和标准正态的分布函数。本小节讨论一种特殊的响应函数，称为典则响应函数。其来源的基本思想是，我们希望响应函数是从标签值的分布中自然导出来的，因此我们需要对预先假设的分布的密度函数进行变形，使得我们可以 $\theta^Tx$ 来估计某个无范围限制的参数。
显然，密度函数的值必须大于0，因此自然的变换为

先进行log变换，在进行exp变换。

这样我们就可以提炼出 $exp(f(\eta))$ 中的参数 $\eta$ ，参数 $\eta$ 必须是充分的，即我们给出它的估计后，这个分布就可以被完全确定下来了。显然 $\eta$ 的范围在 $R$ 中均是有意义的，因为密度函数值始终大于0。此时就可以直接假设 $\eta = \theta^Tx$ ，假设未进行变换前的参数是 $\phi$ ，那么根据 $\eta$ 的选取，总有 $\eta = g^{-1}(\phi)$ ，从而可以反解出 $\phi = g(\eta)$ 。从而得到
$\phi = g(\eta) = g(\theta^Tx)$ 因此这实际上就等价与我们选用了上式的 $g ()$ 作为响应函数，这样选取得到的 $g ()$ 称为典则响应函数，其逆函数 $g^{-1}()$ 称为典则联系函数。

广义线性模型的系统化定义

指数型分布簇
密度函数可以改写为如下形式的分布，属于指数型分布簇：
$p(y;\eta) = b(y)exp(\eta^{'}T(y)-a(\eta))$

最低0.47元/天解锁文章

_Volcano

关注

0
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
机器学习笔记——4 广义线性模型的基本思想和各个常用的回归特例(附logistic模型的python实现)

广义线性模型(Generalized Liner Model)的基本思想和常用的回归特例为什么需要广义线性模型？“广义”和“线性”的含义是什么？首先我们需要解释线性的重要性。线性之所以如此重要，其本质原因在于两方面：线性形式相对是简单的，而且我们擅长处理线性问题，无论是在工程实现上还是在数学分析上。在线性的世界里，无论是对象本身的描述还是变换的描述，我们都有很好的工具和语言去运用和表述它...
复制链接

扫一扫

专栏目录