白话斯坦福机器学习课程-CS229 - 监督学习应用：梯度下降

咻咻职位搜索引擎

已于 2022-06-22 15:10:49 修改

阅读量373

点赞数

分类专栏：机器学习 Machine Learning 文章标签： CS229 吴恩达机器学习笔记

于 2018-10-30 01:02:51 首次发布

本文链接：https://blog.csdn.net/whjay520/article/details/83515856

版权

这篇博客详细记录了斯坦福大学CS229机器学习课程中关于监督学习的应用，特别是梯度下降法在最小化损失函数J(θ)中的作用。博客介绍了如何通过线性表示来预测房价，讨论了回归问题和分类问题，并重点讲解了梯度下降和正规方程两种优化算法，用于找到最优参数θ。

摘要由CSDN通过智能技术生成

记录较全的 CS229 的 ML 笔记

在监督学习问题中，算法会知道每个样本的正确答案是什么，并希望学习算法对于新的输入能输出大致相同的答案。如房价预测的例子，可能有一组训练样本，会告诉算法，对于每一个集合中的样本，什么是它“正确”的房价；之后会希望这个算法能够学习房屋大小和房屋价格之间的关系。并且能够产生出更多“正确”的答案。

回归问题： 如自动驾驶；比如汽车尝试预测表示行驶反向的连续变量的值。
分类问题： 如垃圾邮件分类。

这里主要将一个监督学习的算法，同时它可以归约于一个回归任务；如房价预测的例子：
在这里插入图片描述

其对应的数据分布图：
在这里插入图片描述

Question 1 给一个训练数据的集合，如第一张图里的数据，能否学会预测第二张图中房屋大小和房价之间的关系？

2.1 符号表示：

$m$ : 表示训练样本的数目，也就是第一张图里面数据的行数（房子的大小、价格的数目）。
$x$ : 表示输入变量，通常称为特征（feature）。
$y$ : 表示输出变量，或者称为目标变量。
$(x, y)$ : 表示一个样本
$n$ : 学习问题中特征的数目
$x^i,y^i)$ : 第 $i$ 个训练样本或说表中的第 $i$ 行。用括号括起来的上标 $i$ 表示训练样本列表中的第 $i$ 行
这里面，喊 $j$ 的下标是针对特征向量从 0 到 n， $i$ 的下标是从 1 到 m，针对的是训练样本。

在监督学习中，一般会先找到一个训练集合，然后将由 $m$ 个训练样本组成的训练集合，提供给学习算法；然后算法会生成一个输出函数( $h$ )，这个函数称为假设函数。这个假设函数的任务就是：接收输入，比如说一个用平方英尺表示的新的面积并输出对房价的估计。即假设 $h$ 将输入 $x$ 映射到输出 $y$ ，流程图如下：
(img)
那么，为了设计学习算法，第一步要做的是：决定应该怎样表示假设！对于这里的第一个学习算法来说，要对假设函数进行线性表示，即把假设函数表示成：
$h(x) =θ_0 + θ _1x_1$ ， $x$ 是一个输入特征，这里对应的就是要考虑的房子大小。
通常情况下，许多回归问题都需要多个输入特征，这里新增一个特征：房子的卧室数量，如下图：
在这里插入图片描述
这样，训练集合就可以有第二个特征，表示房子的卧室数量；那么，使用 $x_1$ : 表示房子的大小和平方公尺， $x_2$ ：表示卧室的数量；这时候假设函数就写成：
$h(x) =h_ θ(x) = θ_0 + θ _1x_1 + θ _2x_2$ 。
这就是假设：即对于特征 $x$ 预测的开销（代价）；给定房子的特征 $x$ ，一个明确的房子大小和一个明确的卧室数，预测出的开销；

为了写法便捷，定义 $x_0 = 1$ ，则假设函数可表示为：
$\sum_{i=0}^2\ θ _ix_i= θ ^Tx$

最低0.47元/天解锁文章

咻咻职位搜索引擎

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
白话斯坦福机器学习课程-CS229 - 监督学习应用：梯度下降

在监督学习问题中，算法会知道每个样本的正确答案是什么，并希望学习算法对于新的输入能输出大致相同的答案。如房价预测的例子，可能有一组训练样本，会告诉算法，对于每一个集合中的样本，什么是它“正确”的房价；之后会希望这个算法能够学习房屋大小和房屋价格之间的关系。并且能够产生出更多“正确”的答案。回归问题：如自动驾驶；比如汽车尝试预测表示行驶反向的连续变量的值。分类问题：如垃圾邮件分类。这......
复制链接

扫一扫

专栏目录