机器学习第一周（代价函数的工作原理）

最新推荐文章于 2024-07-14 21:21:42 发布

PL_涵

最新推荐文章于 2024-07-14 21:21:42 发布

阅读量61

点赞数

分类专栏：【入门学习ML】文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/PL_hfc/article/details/130893131

版权

【入门学习ML】专栏收录该内容

15 篇文章 1 订阅

订阅专栏

代价函数的工作原理

线性模型
在线性回归模型中，我们希望得到一条拟合数据集的直线，所以我们构造了上图所示的假设函数 $h_\theta(x)$ ，其中包含两个参数 $\theta_0和\theta_1$ ，随着所选择参数的不同，我们会得到不同的直线。

$J(\theta_0,\theta_1)$ 是我们的代价函数； $\large_{\;\;\;\theta_0,\theta_1}^{minimize}$ $J(\theta_0,\theta_1)$ 是优化目标。

1. 简化的代价函数

为了更好的使代价函数 $J(\theta_0,\theta_1)$ 可视化，我们首先使用一个简化的代价函数来进行分析

代价函数与之前类似，只不过现在 $h_\theta(x)=\theta_1x$ ，即我们令参数 $\theta_0=0$ ，相当于我们只选择了经过原点的假设函数，使用简化的代价函数可以帮助我们更好地理解代价函数的概念。
函数图像
上图左边是我们绘制的假设函数 $h_\theta(x)=\theta_1x$ 的图像，很显然，在参数 $\theta_1$ 确定的条件下， $h_\theta(x)$ 是关于 $x$ 的函数，其中叉叉表示我们的数据集，它们分别是 $(1, 1), (2, 2), (3, 3)$ ，可知样本数量 $m = 3$ 。

右边是我们绘制的简化后的代价函数 $J(\theta_1)$ ，根据代价函数的表达式 $J(\theta_1)=$ $\,\Large1\over {2m}$ $\large\sum_{i=1}^m$ $(h_\theta(x^i)-y^i)^2$ ，可知 $J(\theta_1)$ 是关于参数 $\theta_1$ 的函数。

对于参数 $\theta_1$ 不同的取值，我们都可以在左边绘制出假设函数对应的直线，再根据代价函数的计算公式，我们就可以在右边的图像中绘制出代价函数对应的点，最终在 $\theta_1$ 不同的取值下，我们可以绘制出代价函数 $J(\theta_1)$ 对应的图像，可知当 $J(\theta_1)$ 只有一个参数时，其对应的是一个平面上的二维图像。

我们学习算法的优化目标是通过选择 $\theta_1$ 不同的取值，获得最小的代价函数 $J(\theta_1)$ ，这就是线性回归的目标函数 $\large_{\;\;\;\;\;\theta_1}^{minimize}$ $J(\theta_1)$ 。

2. 原始的代价函数

函数图像
上图左边是我们绘制的假设函数 $h_\theta(x)=\theta_0+\theta_1x$ 的图像，很显然， $h_\theta(x)$ 是关于 $x$ 的函数，当我们取 $\theta_0=50,\;\theta_1=0.06$ 时，得到的假设函数为 $h_\theta(x)=50+0.06x$ ，其对应的直线如图所示。

右边是原始的代价函数 $J(\theta_0,\theta_1)$ ，根据代价函数的表达式 $J(\theta_0,\theta_1)=$ $\,\Large1\over {2m}$ $\large\sum_{i=1}^m$ $(h_\theta(x^i)-y^i)^2$ ，可知 $J(\theta_0,\theta_1)$ 是关于参数 $\theta_0,\theta_1$ 的函数。

对于参数 $\theta_0,\theta_1$ 不同的取值，我们都可以在左边绘制出假设函数对应的直线，再根据代价函数的计算公式，我们就可以计算出代价函数对应的值，最终在 $\theta_0,\theta_1$ 不同的取值下，我们就可以绘制出代价函数 $J(\theta_0,\theta_1)$ 对应的图像
代价函数图像
可知当代价函数 $J(\theta_0,\theta_1)$ 有两个参数时，其对应的是空间内的三维图像。

当我们取不同的 $\theta_0,\theta_1$ 时， $J(\theta_0,\theta_1)$ 的值就是曲面上 $(\theta_0,\theta_1)$ 这一点对应的高度。

为了更好地展示代价函数 $J(\theta_0,\theta_1)$ ，我们使用等高线图来表示 $J(\theta_0,\theta_1)$ 与 $\theta_0,\theta_1$ 之间对应的关系。

右边等高线图中的每一个椭圆都代表了 $J(\theta_0,\theta_1)$ 相等时的一系列 $\theta_0,\theta_1$ 的不同取值，很显然，当椭圆越大时，说明取到这个 $J(\theta_0,\theta_1)$ 值的 $(\theta_0,\theta_1)$ 越多，所以 $J(\theta_0,\theta_1)$ 的最小值在等高线图中应该是最小的等高线，即只会有一组 $(\theta_0,\theta_1)$ 满足优化目标，在图像中就对应着一个点。

通过上述的例子，我们可以发现，当代价函数 $J(\theta)$ 中的参数越多时，其对应的函数图像维度也就越高，我们就无法通过手动的方式来解决，我们真正想要的是一种高效的算法，可以通过软件实现的算法，来自动找寻代价函数 $J(\theta)$ 的最小值其对应的参数 $\theta$ 。

PL_涵

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习第一周（代价函数的工作原理）

不同的取值，我们都可以在左边绘制出假设函数对应的直线，再根据代价函数的计算公式，我们就可以在右边的图像中绘制出代价函数对应的点，最终在。不同的取值，我们都可以在左边绘制出假设函数对应的直线，再根据代价函数的计算公式，我们就可以计算出代价函数对应的值，最终在。，相当于我们只选择了经过原点的假设函数，使用简化的代价函数可以帮助我们更好地理解代价函数的概念。在线性回归模型中，我们希望得到一条拟合数据集的直线，所以我们构造了上图所示的假设函数。，随着所选择参数的不同，我们会得到不同的直线。
复制链接

扫一扫