《machine learning》2单变量线性回归

最新推荐文章于 2024-09-02 23:11:05 发布

ElonZhou99

最新推荐文章于 2024-09-02 23:11:05 发布

阅读量228

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/SuperJayzz1/article/details/109048615

版权

线性回归损失函数梯度下降模型优化平方误差

关键词由CSDN通过智能技术生成

深度学习专栏收录该内容

14 篇文章 0 订阅

订阅专栏

二、单变量线性回归Linear Regression woth One Variable

2.1 模型描述

训练数据集=>学习任务=>输出假设函数 $h (x)$

$m$ 训练样本数
$x$ 输入变量/特征
$y$ 输出变量
$x^{(i)} , y^{(i)} )$ 第i个样本

2.2 损失函数

选择合适的模型参数parameters使 $h(x)-y)^2$ （预测值和真实值的误差）尽可能的小。
对于回归问题平方误差函数最常用的是平方误差函数： $J(\theta_0 , \theta_1) = {1 \over 2m}\sum_{i=1}^{m}(h(x)^{(i)} - y^{(i)})^2$

2.3 损失函数直观理解

假设函数Hypothesis： $h_ \theta(x) = \theta_0 + \theta_xx$
模型参数Parameters: $\theta_0, \theta_1$
损失函数Cost Function: $J(\theta_0, \theta_1) = {1\over2m}\sum_{i=1}^m(h(x^{(i)}) - y^{(i)})^2$
优化目标Goal： $-J(\theta_0, \theta_1)$
将 $\theta_0=0$ ， $h_\theta(x) = \theta_xx$ ：
在这里插入图片描述
保留 $\theta_0$ ， $h_ \theta(x) = \theta_0 + \theta_xx$ :

在这里插入图片描述

2.5 梯度下降

函数function： $J(\theta_0, \theta_1)$ (可应用与更多的参数)
目标want： $J(\theta_0, \theta_1)$
Outline:

给定初始值 $\theta_0, \theta_1$ （通常为0）
改变 $\theta_0, \theta_1$ 的值去减少 $J(\theta_0, \theta_1)$
直到损失函数J得到最小值或局部最小值

梯度下降：起点不同可能会得到完全不同的局部最优解
数学原理：更新 $\theta_0,\theta_1$ 重复以下工作直到收敛
{
$\theta_j := \theta_j - \alpha{\partial\over\partial\theta_j}J(\theta_0, \theta_1)\quad$ (for j = 0 and j = 1)
}
其中的 $\alpha$ 是学习率， $\alpha$ 越大，梯度下降越迅速。
$\alpha$ 太小，梯度计算步数越多；太大则可能不收敛甚至发散
注意在更新 $\theta_0,\theta_1$ 时必须两个paramaters同时更新。
将 $\theta_0,\theta_1$ 分别求梯度后赋值给temp0和temp1之后，再将temp0和temp1同时赋值给 $\theta_0,\theta_1$ 。参数全部求完梯度之后同时赋值。
正确做法：
temp0 := $\theta_0 - \alpha{\partial\over\partial\theta_0}J(\theta_0, \theta_1)$
temp1 := $\theta_1 - \alpha{\partial\over\partial\theta_1}J(\theta_0, \theta_1)$
$\theta_0$ := temp0
$\theta_1$ := temp1
错误做法：
temp0 := $\theta_0 - \alpha{\partial\over\partial\theta_0}J(\theta_0, \theta_1)$
$\theta_0$ := temp0
temp1 := $\theta_1 - \alpha{\partial\over\partial\theta_1}J(\theta_0, \theta_1)$
$\theta_1$ := temp1
在 $\theta_1$ 求梯度的时候， $\theta_0$ 的值已经改变了，没做到同步更新。

2.6 梯度下降直观理解

简化函数： $\theta_0=0$
在这里插入图片描述

当处于 $\theta_j$ 时函数J达到最小值，那么梯度下降公式 $\theta_j := \theta_j - \alpha{\partial\over\partial\theta_j}J(\theta_j)$ 导数部分为0，参数 $\theta_j$ 不再改变。
梯度下降算法：
接近最小点的过程中，导数值越来越小，步幅自动变小直到达到最小点步幅为0。

2.7 梯度下降的线性回归

$J(\theta_0, \theta_1)={1\over2m}\sum_{i=1}^m(h_\theta(x)^{(i)} - y^{(i)})^2$
${\partial\over\partial\theta_j}J(\theta_0, \theta_1)={\partial\over\partial\theta_j}*{1\over2m}\sum_{i=1}^m(h_\theta(x)^{(i)} - y^{(i)})^2={\partial\over\partial\theta_j}*{1\over2m}\sum_{i=1}^m(\theta_0+\theta_1x^{(i)}-y^{(i)})^2$
$j=0:{\partial\over\partial\theta_0}J(\theta_0, \theta_1)={1\over m}\sum_{i=1}^m(h_\theta(x)^{(i)} - y^{(i)})$
$j=1:{\partial\over\partial\theta_1}J(\theta_0, \theta_1)={1\over m}\sum_{i=1}^m(h_\theta(x)^{(i)} - y^{(i)})*x^{(i)}$
在这里插入图片描述
“Batch”梯度下降：历遍了所有的训练数据集

ElonZhou99

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《machine learning》2单变量线性回归

二、单变量线性回归Linear Regression woth One Variable2.1 模型描述训练数据集=>学习任务=>输出假设函数h(x)h(x)h(x)mmm 训练样本数xxx 输入变量/特征yyy 输出变量(x(i),y(i))( x^{(i)} , y^{(i)} )(x(i),y(i))第i个样本2.2 代价函数选择合适的模型参数parameters使(h(x)−y)2(h(x)-y)^2(h(x)−y)2（预测值和真实值的误差）尽可能的小。对于回
复制链接

扫一扫

专栏目录