Standford 机器学习—第一讲 Linear Regression with one variable(单变量线性回归)

最新推荐文章于 2024-07-25 12:32:58 发布

Geek-Yan

最新推荐文章于 2024-07-25 12:32:58 发布

阅读量383

点赞数

分类专栏： machine learning 文章标签：机器学习 machine-learning

本文链接：https://blog.csdn.net/bmwopwer1/article/details/61418905

版权

machine learning 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

Linear Regression with one variable(单变量线性回归)

Linear Regression with one variable单变量线性回归

本栏目（Machine learning）包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM（Support Vector Machines 支持向量机）、聚类、降维、异常检测、大规模机器学习等章节。所有内容均来自Standford公开课machine learning中Andrew NG老师的讲解。

什么是线性回归

线性回归是给出一系列点假设拟合直线为 $h(x)=\theta_{0}+\theta_1x$ , 记Cost Function为 $J(\theta_0,\theta_1)$
之所以说单参数是因为只有一个变量x，即影响回归参数 $\theta_1,\theta_0$ 的是一维变量，或者说输入变量只有一维属性。

代价函数 cost function

1. 公式：

J (θ 0, θ 1) = 1 2 m \sum i = 1 m (h θ (x (i)) - y (i)) 2

$J(\theta_0, \theta_1) = \frac{1}{2m}\sum_{i=1}^{m}(h\theta(x^{(i)})-y^{(i)})^2$

2. 作用：

能够帮助我们找到最适合我们训练集的线。代价函数也叫作平方误差函数。对大多数问题，特别是回归问题，是一个合理的选择。

Gradient Descent 梯度下降算法

梯度下降是用来求最小值的算法，我们可以用这个算法来求出代价函数 $J(\theta_0, \theta_1)$ 最小值

思路：
将函数比作一座山，我们站在某个山坡上，往四周看，从哪个方向向下走一小步，能够下降的最快。

Batch gradient descent 批量梯度下降

1. 公式：

$\theta_{j}:=\theta_j- \alpha \tfrac{\partial}{\partial\theta_j}J(\theta_0,\theta_1)$ for j=0 and j=1
其中 $\alpha$ 表示学习率(learning rate), 决定了下降的速度有多快。

注意：必须同时更新 $\theta_0和\theta_1$

具体更新如下：
$temp_0:=\theta_0- \alpha \tfrac{\partial}{\partial\theta_j}J(\theta_0,\theta_1)$
$temp_1:=\theta_1- \alpha \tfrac{\partial}{\partial\theta_j}J(\theta_0,\theta_1)$
$\theta_0 := temp_0$
$\theta_1 := temp_1$

2. 学习率 $\alpha$ 的大小

如果 $\alpha$ 太小，那么会导致速度很慢，需要很多步骤才能找到全局最低点。
如果 $\alpha$ 太大，那么梯度下降算法可能会越过最低点，导致结果无法收敛，甚至发散

$$\alpha$太大，容易过学习$

问题：如果 $\theta_1$ 初始化在局部最低点，梯度下降算法会怎样工作?
答： $\theta_1$ 在局部最低点，表示倒数等于0，斜率为0，梯度下降算法将什么都不做

3.对代价函数求导

θ 0 : = θ 0 - α 1 m \sum i = 1 m (h θ (x (i)) - y (i))

$\theta_0:=\theta_0-\alpha \tfrac{1}{m}\sum_{i=1}^{m}(h_\theta(x^{(i)})-y^{(i)})$

θ 1 : = θ 1 - α 1 m \sum i = 1 m ((h θ (x (i)) - y (i)) * x (i))

$\theta_1:=\theta_1-\alpha \tfrac{1}{m}\sum_{i=1}^{m}((h_\theta(x^{(i)})-y^{(i)})*x^{(i)})$

Geek-Yan

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Standford 机器学习—第一讲 Linear Regression with one variable(单变量线性回归)

Linear Regression with one variable(单变量线性回归)Linear Regression with one variable单变量线性回归什么是线性回归代价函数 cost function公式作用Gradient Descent 梯度下降算法Batch gradient descent 批量梯度下降公式学习率alpha的大小对代价函数求导本栏目（M
复制链接

扫一扫