吴恩达机器学习2——单变量线性回归

最新推荐文章于 2022-10-26 18:22:45 发布

wxb_2021.8.1

最新推荐文章于 2022-10-26 18:22:45 发布

阅读量992

点赞数 2

分类专栏：吴恩达机器学习笔记文章标签：机器学习 sklearn 深度学习

本文链接：https://blog.csdn.net/wxb_cxydad/article/details/119299940

版权

吴恩达机器学习笔记专栏收录该内容

4 篇文章 0 订阅

订阅专栏

吴恩达机器学习2——单变量线性回归

监督学习工作模式
在这里插入图片描述
训练集中同时给出了输入输出，即人为标注的“正确结果”喂给学习算法，得到一个函数h，h
可以根据输入的x得到一个y，因此h是x到y的一个映射。
一种可能的表达方式为：
hθ(x)=θ0+θ1x
因为只含有一个特征/输入变量，因此这样的问题叫作单变量线性回归问题。
x：特征/输入变量
上式中， θ为参数， θ 的变化才决定了输出结果，不同以往，这里的 x 被我们视作已知(不论是数据集还是预测时的输入)，所以怎样解得 θ以更好地拟合数据，成了求解该问题的最终问题。

2.2代价函数（cost function）

损失函数（loss function）：计算单个样本的误差
代价函数（cost function）：计算整个训练集所有损失函数之和的平均值

我们的目的在于求解预测结果h最接近实际结果y时θ的取值。
为求解最小值，引入代价函数（cost function）的概念
在这里插入图片描述
问题转化为求解J（θ0，θ1）的最小值
系数1/2不影响结果，是为了在应用梯度下降时，平方的导数抵消1/2，便于计算。

假设θ0=0，得到的hθ（x）和J（θ1）如下
在这里插入图片描述

以此类推，θ≠0时
在这里插入图片描述

可以看出仍存在一点使J（θ0，θ1）最小.

2.5梯度下降（gradient descent）

梯度下降背后的思想是：开始时，我们随机选择一个参数组合（θ0，θ1，…θn）即起始点，计算代价函数，然后寻找下一个能使得代价函数下降最多的参数组合。不断迭代，直到找到一个局部最小值(local minimum)，由于下降的情况只考虑当前参数组合周围的情况，所以无法确定当前的局部最小值是否就是全局最小值(global minimum)，不同的初始参数组合，可能会产生不同的局部最小值。
在这里插入图片描述
批量梯度下降（batch gradient descent）算法的公式为：