《机器学习》学习笔记（第3章线性模型）

最新推荐文章于 2024-07-22 22:33:49 发布

SongzeLiCEMA

最新推荐文章于 2024-07-22 22:33:49 发布

阅读量110

点赞数

本文链接：https://blog.csdn.net/qq_42953341/article/details/119855112

版权

这篇笔记探讨了机器学习中的线性模型，包括线性回归的最小二乘估计和广义线性模型在分类任务中的应用。线性模型通过属性的线性组合进行预测，而在分类问题中，如二分类，会使用Sigmoid函数结合极大似然估计来确定模型参数。此外，线性判别分析（LDA）也被提及作为另一种分类方法。

摘要由CSDN通过智能技术生成

《机器学习》学习笔记（第3章线性模型）

参考资料：周志华《机器学习》以及Datawhale 吃瓜教程

机器学习三要素

首先回顾一下直播课中概括的机器学习三要素：

模型：根据具体问题，确定假设空间
策略：根据评价标准，确定求解最优模型的策略（通常会产生一个“损失函数”）
算法：求解损失函数，确定最优模型

线性模型与回归学习

线性模型试图学得一个通过属性的线性组合进行预测的函数，其基本形式为：
$f(\bold{x})=\bold{w}^{T}\bold{x}+b$

线性模型形式简单，具有良好的可解释性。我们通过最小化均方误差来确定参数 $\bold{w}$ 和 $b$ ：
$(\bold{w}^*,b^*)=\arg\min_{(w,b)}\sum_{i=1}^m(y_i-f(\bold{x}_i))^2$
均方误差可以视为样本真实值与预测值的欧氏距离平方和。上述求解参数的过程称为线性回归模型的最小二乘参数估计。事实上，若我们引入误差项 $\epsilon_i=y_i-f(\bold{x_i})$ ，并且 $\epsilon_i\sim N(0,\sigma^2)$ ，可以证明此时最小二乘估计与极大似然估计等价。

若记 $\hat{\bold{w}}=(\bold{w};b)$ ，则最优参数 $\hat{\bold{w}}^*$ 可表示为矩阵形式：
$\hat{\bold{w}}^*=(\bold{X}^\text{T}\bold{X})^{-1}\bold{X}^\text{T}y$
上式成立要求 $\bold{X}^\text{T}\bold{X}$ 满秩。若样本数少于变量数（矩阵 $\bold{X}$ 的行数少于列数），那么 $\hat{\bold{w}}^*$ 存在多个解。此时解的选取由学习算法的归纳偏好决定，常见的做法是引入正则化项。

广义线性模型与分类学习

除了回归学习之外，线性模型还可用于分类任务。此时需用到广义线性模型，即寻找一个单调可微函数将分类任务的真实标记与线性回归模型的预测值联系起来。以二分类问题为例，我们需要找到一个Sigmoid函数（形似"S"的函数）来近似最理想的单位阶跃函数：

对数几率函数是一种常用的Sigmoid函数：
$y=\frac{1}{1+e^{(\bold{w}^{T}\bold{x}+b)}}$
此时，我们可以通过极大似然法来估计参数 $\bold{w}$ 和 $b$ 。由于我们无法确定封闭解，所以需要使用数值优化算法（例如梯度下降法和牛顿法）来求得最优解。