机器学习 | 回归算法原理——最小二乘法

半亩花海

已于 2024-07-23 17:05:38 修改

阅读量476

点赞数 12

分类专栏：机器学习学习笔记文章标签：最小二乘法回归算法机器学习

于 2024-07-23 16:49:43 首次发布

本文链接：https://blog.csdn.net/ttrr27/article/details/140607968

版权

学习笔记同时被 2 个专栏收录

16 篇文章 0 订阅

订阅专栏

机器学习

4 篇文章 0 订阅

订阅专栏

Hi，大家好，我是半亩花海。很早便想学习并总结一本很喜欢的机器学习图书——立石贤吾的《白话机器学习的数学》，可谓通俗易懂，清晰形象。那就在此分享并作为学习笔记来记录我的学习过程吧！本章的回归算法原理基于《基于广告费预测点击量》项目，欢迎大家交流学习！

一、最小二乘法概述

最小二乘法（又称最小平方法）是一种数学优化技术。它通过最小化误差的平方和（ $min E(\theta)$ ）寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据，并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法同梯度下降类似，都是一种求解无约束最优化问题的常用方法，并且也可以用于曲线拟合，来解决回归问题。

二、案例分析

下面根据《基于广告费预测点击量》这一项目展开最小二乘法的介绍和分析。

1. 设置问题

假设存在这样一个前提：投入的广告费越多，广告的点击量就越高，进而带来访问数的增加。这样看这种假设类似于线性关系，但实际上两者之间未必是简单的线性关系。

根据广告费和实际点击量的对应关系数据，可以将两个变量用下面的图展示出来，如下图（图中的值是随便选的）。

我们看着这张图可以猜猜，如果花了200日元的广告费，广告的点击量会是多少呢？通过探索估计，大概在500次左右吧。

这就是机器学习。我们所做的事情正是从数据中进行学习，然后给出预测值。接下来我们就要使用机器学习，像我们刚才做的那样尝试进行根据广告费预测点击量的任务。

当然，实际要使用机器学习来解决的问题都会更复杂，很多问题无法像这样画出图来。现在我们为了加深理解才用了这样一个简单的例子，后面的例子会越来越难的。

2. 定义模型

那我们如何应用机器学习呢？就刚刚的例子，如下图所示，我们可以把图想象为函数。只要知道通过图中各点的函数的形式就能根据广告费得知点击量了。但是点击量经常变化，这叫作“点击量中含有噪声”，所以函数并不能完美地通过所有的点。

这样看便是我们初中便学过的一次函数，考虑到后面的学习（为了防止当未知数增加时，表达式中大量出现 a、b、c、d…这样的符号），我们常常使用如下的“ $\theta$ + 数字下标”的形式来表示未知数和推测值，进而定义一次函数的表达式。

$y=\theta_0+\theta_1 x$

比如，我们先任取两个数作为 $\theta_{0}$ 、 $\theta_{1}$ ，假设 $\theta_{0} =1$ ， $\theta_{1} =2$ ，那么当广告费为 100 日元时，点击量的计算过程如下：

$y = 1 + 2x = 1 + 2 \times 100 = 201$

函数 y = 1 + 2x 的部分点信息如下：

但实际上我们再看一下刚才的图会发现，如果广告费为 100 日元，那么点击量应该大于 400。

这说明我们刚才确定的参数 $\theta_{0} =1$ ， $\theta_{1} =2$ 完全不正确。接下来我们就要使用机器学习来求出正确的 $\theta_{0}$ 和 $\theta_{1}$ 的值。

3. 最小二乘法

假设有 n 个训练数据，那么它们的误差之和可以用下面的表达式 $E(\theta)$ 表示。这个表达式称为目标函数（其中， $E(\theta)$ 的 E 是误差的英语单词 Error 的首字母）。（ps：计算误差一般不用绝对值，而用平方。因为之后要对目标函数进行微分，比起绝对值，平方的微分更加简单。）

$E(\theta)=\frac{1}{2} \sum_{i=1}^n\left(y^{(i)}-f_\theta\left(x^{(i)}\right)\right)^2$

其中， $f_\theta(x)$ 表达式为：

$f_\theta(x)=\theta_0+\theta_1 x$

其次， $x^{(i)}$ 和 $y^{(i)}$ 中的 i 不是 i 次幂的意思，而是指第 i 个训练数据。

再者，误差解释一下，如下图所示，图中的双向虚线箭头表示训练数据的点和 $f_\theta(x)$ 图像的误差。

我们实际来计算一下表达式 $f_\theta(x)$ 中 $E(\theta)$ 的值吧。设 $\theta_{0} =1$ ， $\theta_{1} =2$ ，然后将刚才列举的 4 个训练数据代入表达式。求出来的误差有点大……

$\begin{aligned} E(\theta) & =\frac{1}{2} \sum_{i=1}^4\left(y^{(i)}-f_\theta\left(x^{(i)}\right)\right)^2 \\ & =\frac{1}{2} \times\left((374-117)^2+(385-141)^2+(375-163)^2+(401-169)^2\right) \\ & =\frac{1}{2} \times(66049+59536+44944+53824) \\ & =112176.5 \end{aligned}$

上述结果 112 176.5 这个值本身没有什么意义，我们要通过一些方法修改参数 $\theta$ ，如之后所学习的神经网络中的调参等方式，使得这个值变得越来越小。这种做法称为最小二乘法。

半亩花海

关注

12
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
机器学习 | 回归算法原理——最小二乘法

Hi，大家好，我是半亩花海。很早便想学习并总结一本很喜欢的机器学习图书——立石贤吾的《白话机器学习的数学》，可谓通俗易懂，清晰形象。那就在此分享并作为学习笔记来记录我的学习过程吧！本章的回归算法原理基于《基于广告费预测点击量》项目，欢迎大家交流学习！
复制链接

扫一扫

专栏目录