详解最小二乘法

最新推荐文章于 2024-06-30 17:04:22 发布

twdlll

最新推荐文章于 2024-06-30 17:04:22 发布

阅读量2.5k

点赞数 2

分类专栏：算法文章标签：机器学习最小二乘法

本文链接：https://blog.csdn.net/twdlll/article/details/79880433

版权

本文详细解析了最小二乘法在机器学习中用于求解线性模型最优参数的原因和过程。从线性模型的定义出发，讨论了误差的正态分布假设，通过极大似然估计和对数似然函数推导出最小二乘法的目标是最小化预测误差平方和。文章还介绍了最小二乘法的求解步骤，包括矩阵求导的相关知识。

摘要由CSDN通过智能技术生成

最小二乘法

在阅读西瓜书时，一开始很疑惑为什么可以用最小二乘法去求解线性模型的最优参数解，后来通过学习Andrew Y. Ng的机器学习课程终于明白了最小二乘法求参的缘由，并分享给大家我的理解。

由于涉及数学理论的知识，总离不开大量的公式。为了不过于枯燥，我尽量让本文显得通俗易懂些。但其实更希望朋友们能静下心来，细细推导每一个公式的由来，欣赏其中的数学之美。

我们知道在机器学习中有这样一类模型，它叫做线性模型，它的主要表现形式如下所示：
$f(x^i)=\theta^T x^i+ b \qquad(1)$
这里简单介绍一下每个符号的意思：

$x^i$ 表示第 $i$ 个样本，需要注意的是 $x^i$ 并不是一个实数，而是一个拥有 $n$ 个属性的列向量，用公式直观地表示为： ${(x^i)}^T = \{x_1^i, x_2^i,...,x_n^i\}$ ,其中 $x_1^i$ 则代表第 $i$ 个样本的第1个属性，依次类推。
$\theta^T = \{ \theta_1, \theta_2,...,\theta_n\}$ 可以看到 $\theta$ 同样是一个 $n$ 行列向量，其中每一行的值，如 $\theta_1$ 就代表着第一个属性在这个线性分类器的权重。可以发现 $\theta^T x^i = \theta_1 x_1^i + \theta_2 x_2^i +...+\theta_n x_n^i$ 相当于每个属性和其对应的权重相乘，也就是线性模型称号的由来。
$b$ 很好理解，类似于一元函数 $y = a x + b$ 中的 $b$ ，就是线性模型的一个偏移量。
$f(x^i)$ 就是我们的线性回归函数，对于输入的一个样本 $x^i$ ，线性回归函数都会对应地给予一个预测值，即 $f(x^i)$ 。

所以求解线性模型的关键就在于求得 $\theta$ 和 $b$ ，为了求解方便，我们适当对之前的公式进行一些调整：

令 $\theta^T = \{\theta_1, \theta_2,...,\theta_n, b\}$ ，即在原先 $\theta$ 的基础上在加一行,并且使得该行值等于 $b$ ， $\theta \in \Bbb R^{n + 1}$ 。
令 ${(x^i)}^T = \{x_1^i, x_2^i, ... , x_n^i, 1\}$ ，即 $x^i \in \Bbb R^{n+1}$