【机器学习（二）】模型描述与代价函数

趴抖

已于 2022-12-26 21:26:06 修改

阅读量158

点赞数

分类专栏：机器学习文章标签：人工智能算法

于 2022-12-21 14:58:01 首次发布

本文链接：https://blog.csdn.net/PuddleRubbish/article/details/128395216

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

本文围绕吴恩达机器学习系列课程，详细阐述了线性回归模型在预测房价中的应用，介绍了监督学习和回归问题的概念，以及如何通过平方误差代价函数最小化来优化参数θ0和θ1。通过代价函数图像展示了不同参数组合下的拟合效果。

摘要由CSDN通过智能技术生成

声明：本文是以吴恩达机器学习系列课程为学习对象而作的学习笔记。本文对应P5-P8。

模型描述

引例

仍然是上期运用的房价例子：
在这里插入图片描述
假设现出售的房子大小为1250平方英尺，想要推测它的房价。可以进行模型拟合，这组数据似乎适合直线：

根据这个模型，将数据拟合成一个直线后，可以推测1250平方英尺的房子可以卖出220000美元左右的价格。

这是一个监督学习算法的例子。它之所以是监督学习，是因为每个例子都有一个“正确的答案”。而且这也是个回归问题的例子。

正式化表达

在监督学习里，我们有一个数据集，被称为训练集。我们所要做的就是从这个数据中学习如何预测房价。
在这里插入图片描述

监督算法的工作流程

向学习算法提供训练集。学习算法的任务是输出一个函数（通常用h表示），h代表假设函数。假设函数的作用是把房子的大小作为输入变量，把它作为x的值，而它会试着输出相应房子的预测y值。h是一个引导从x得到y的函数。
在这里插入图片描述

当我们设计一个学习算法时，下一个需要做的事情是决定这么表示这个假设函数h，此后便是运用各种函数来拟合的步骤了。

代价函数

平方误差代价函数

在线性回归中我们有一个像这样的训练集：
在这里插入图片描述
M代表了训练样本的数量，即M=47
而图中的假设函数为线性函数形式
接下来谈谈如何选择θ0和θ1这两个参数值。

选择不同的θ0和θ1，我们会得到不同的假设函数：
在这里插入图片描述
因此，想要选择最合适的两个参数，在线性回归中，我们要解决的是一个最小化问题，即需要h(x)和y之间的差异要小，所以我们现在要做的事情就是尽量减少假设的输出与房子真实价格之差的平方：
(hθ(x) - y)^2
我们对所有上式数值进行求和并除以总数：
在这里插入图片描述
因此，简单地说，我们正在把这个问题变成：找到能使我的训练集中预测值和真实值的差的平方的和的1/2M最小的θ0和θ1的值。
代价函数如下：

这种代价函数被称为平方误差代价函数，是解决回归问题最常用的手段之一。