DataWhale吃瓜3章学习（1）

JXN20210043

已于 2024-06-22 22:32:19 修改

阅读量712

点赞数 6

分类专栏：吃瓜文章标签：学习机器学习人工智能

于 2024-06-22 22:26:35 首次发布

本文链接：https://blog.csdn.net/JXN20210043/article/details/139889235

版权

吃瓜专栏收录该内容

7 篇文章 0 订阅

订阅专栏

第三章：线性模型（1）

3.1 线性模型的基本形式

线性模型试图通过属性的线性组合来进行预测。数学公式为：

$w_{1}x_{1} + w_{2}x_{2} + \dots + w_{d}x_{d} + b$

其中， $(x_{1}, x_{2}, \dots, x_{d})$ 是输入特征向量， $(w_{1}, w_{2}, \dots, w_{d})$ 是权重向量， $b$ 是偏置项。模型一旦确定，对于任何输入 $x$ ，我们可以通过计算 $f (x)$ 来得到预测值。

3.2 线性回归

3.2.1 线性回归的数学描述

给定数据集 $D = \{(x_{i}, y_{i})\}$ ，其中 $x_{i}$ 是输入特征向量， $y_{i}$ 是对应的输出标记。线性回归的目标是找到最优的参数 $w$ 和 $b$ ，使得预测值 $f(x_{i})$ 尽可能接近真实标记 $y_{i}$ 。通常使用均方误差（MSE）作为损失函数，即：

$\text{MSE} = \frac{1}{m} \sum_{i=1}^{m} (f(x_{i}) - y_{i})^2$

其中， $m$ 是样本数量。

我们尝试将MSE最小化：
$\begin{aligned}\left(w^{*}, b^{*}\right) & =\underset{(w, b)}{\arg \min } \sum_{i=1}^{m}\left(f\left(x_{i}\right)-y_{i}\right)^{2} \\& =\underset{(w, b)}{\arg \min } \sum_{i=1}^{m}\left(y_{i}-w x_{i}-b\right)^{2}\end{aligned}$

3.2.2 最小二乘法

最小二乘法是通过最小化损失函数来求解 $w$ 和 $b$ 的方法。对于线性回归问题，我们可以通过求导数并令其为零来找到最小化均方误差的 $w$ 和 $b$ 。我们对 $w$ 和 $b$ 分别求偏导数，并令它们等于零：

$\begin{array}{l}\frac{\partial E_{(w, b)}}{\partial w}=2\left(w \sum_{i=1}^{m} x_{i}^{2}-\sum_{i=1}^{m}\left(y_{i}-b\right) x_{i}\right) \\\frac{\partial E_{(w, b)}}{\partial b}=2\left(m b-\sum_{i=1}^{m}\left(y_{i}-w x_{i}\right)\right)\end{array}$

这将给出 $w$ 和 $b$ 的最优解。在实际操作中，我们通常会将这些方程写成矩阵形式，以便利用矩阵运算进行快速求解。当设计矩阵 $X$ 满秩或者正定的时候，最优解可以表示为：

$w^{*} = (X^TX)^{-1}X^T y, \quad b^{*} = \overline{y} - w^{*T} \overline{x}$

其中， $\overline{x}$ 是所有输入特征的均值向量， $\overline{y}$ 是所有输出标记的均值。

3.2.3 多变量线性回归

当我们有多个输入特征时，线性回归模型可以表示为：

$f(x) = w^T x + b$

此时，我们需要对权重向量 $w$ 和偏置项 $b$ 进行估计。这可以通过最小二乘法来完成，即通过最小化均方误差来求解 $w$ 和 $b$ 。在多变量情况下，最优解的表达式与单变量情况类似：

$w^{*} = (X^TX)^{-1}X^T y, \quad b^{*} = \overline{y} - w^{*T} \overline{x}$

JXN20210043

关注

6
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
DataWhale吃瓜3章学习（1）

线性模型试图通过属性的线性组合来进行预测。fxw1x1w2x2⋯wdxdb其中，xx1x2xd是输入特征向量，ww1w2wd是权重向量，b是偏置项。模型一旦确定，对于任何输入x，我们可以通过计算fx来得到预测值。
复制链接

扫一扫