机器学习入门（吃瓜第三章(1) 线性回归）

星星子Yocio

已于 2024-06-25 23:25:10 修改

阅读量672

点赞数 16

文章标签：机器学习 python 人工智能

于 2024-06-23 00:17:48 首次发布

本文链接：https://blog.csdn.net/Serena_yocio/article/details/139890263

版权

机器学习三要素

模型：根据具体问题，确定假设空间。
策略：根据评价标准，确定选取最优模型的策略（通常会产生一个“损失函数”）。
算法：求解损失函数，确定最优模型。

一、一元线性回归

1. 基本形式

一元线性回归模型试图通过输入特征 $x$ 的线性组合来预测输出y。其数学公式为：

向量形式为

其中， $w$ 是权重， b 是偏置项。

2. 最小二乘法

最小二乘法是通过最小化损失函数来求解 $w$ 和 $b$ 的方法。对于线性回归问题，我们可以通过求导数并令其为零来找到最小化均方误差的 $w$ 和 $b$ 。我们对 $w$ 和 $b$ 分别求偏导数，并令它们等于零：

这将给出 $w$ 和 $b$ 的最优解。在实际操作中，我们可以利用矩阵运算加速求解。定义设计矩阵 $X$ 和输出向量 $y$ 后，最优解可以表示为：

其中， $\overline{x}$ 和 $\overline{y}$ 分别是所有输入特征和输出标记的均值向量。

如果要用 Python 实现上式，可以使用 NumPy 库来进行矩阵运算。例如：

import numpy as np

# 假设 X 是输入矩阵，y 是输出向量
X = np.array([...])
y = np.array([...])

# 计算最优解
w = np.linalg.inv(X.T @ X) @ X.T @ y
b = np.mean(y) - w.T @ np.mean(X, axis=0)

3. 极大似然估计法

极大似然估计法的直观想法是：使观测样本出现概率最大的分布就是待求分布，即使得联合概率（似然函数） $L(\theta)$ 取最大值的 $\theta^*$ 即为 $\theta$ 的估计值。

通常对似然函数进行对数变换，用 $ln L(\mu, \sigma^2)$ 代替 $L(\mu, \sigma^2)$ 来求 $\mu$ 和 $\sigma$ 的估计值。

例：正态分布的参数估计

假设有一批观测样本 $x_1, x_2, \ldots, x_n$ ，其服从某个正态分布 $X \sim N(\mu, \sigma^2)$ ，其中 $\mu$ 和 $\sigma$ 为待估计的参数。用极大似然估计法来估计正态分布的参数 $\mu$ 和 $\sigma$ ：

(1) 写出随机变量 $X$ 的概率密度函数：

(2) 写出似然函数：

(3) 对数变换得到对数似然函数：

(4) 求解使得 $\ln L(\mu, \sigma)$ 最大的 $\mu$ 和 $\sigma$ 。

在线性回归中，假设误差ϵ服从均值为 0 的正态分布 ϵ∼N(0,σ2)，则线性模型可以表示为 $y \sim N(wx + b, \sigma^2)$ 。然后使用极大似然估计来估计 $w$ 和 $b$ 的值。

求解参数 $w$ 和 $b$

(1) 写出似然函数：

(2) 对数变换得到对数似然函数：

(3) 对 $w$ 和 $b$ 求偏导数，并令其为零，求得最优解。

4. E(w, b) 的性质

(1) 证明 $E(w, b)$ 是半正定矩阵。

(2) 因此 $E(w, b)$ 是关于 $w$ 和 $b$ 的凸函数。

(3) 凸函数的全局解的充分必要条件是其梯度等于零向量。

二、多元线性回归

1. 向量表示

多元线性回归模型可以表示为：

其中， $x$ 是输入特征向量， $w$ 是权重向量， $b$ 是偏置项。

为了求解多元线性回归的参数，我们需要将损失函数写成矩阵形式，并证明其是凸函数。

损失函数的向量化

定义设计矩阵 $x$ 和输出向量 $y$ 后，损失函数可以表示为：

2. 凸性证明

证明 $E(\hat{w})$ 是 $\hat{w}$ 的凸函数。如果是凸函数，可以令其梯度等于零向量，从而求得全局最优解。

参考文献

[1] 【吃瓜教程】《机器学习公式详解》（南瓜书）与西瓜书公式推导
[2] 周志华.机器学习[M].清华大学出版社,2016.
[3] 谢文睿秦州贾彬彬.机器学习公式详解第2版[M].人民邮电出版社,2023.

星星子Yocio

关注

16
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫