Standford 机器学习—第二讲 Linear Regression with multiple variables(多变量线性回归)

最新推荐文章于 2021-12-03 23:42:42 发布

Geek-Yan

最新推荐文章于 2021-12-03 23:42:42 发布

阅读量784

点赞数

分类专栏： machine learning 文章标签：机器学习

本文链接：https://blog.csdn.net/bmwopwer1/article/details/61420439

版权

machine learning 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

本栏目（Machine learning）包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM（Support Vector Machines 支持向量机）、聚类、降维、异常检测、大规模机器学习等章节。所有内容均来自Standford公开课machine learning中Andrew老师的讲解。

Linear Regression with multiple variables – 多变量线性回归

1. 假设函数

h θ (x) = θ 0 + θ 1 x 1 + θ 2 x 2 + θ 3 x 3

$h\theta(x)=\theta_0+\theta_1x_1+\theta_2x_2+\theta_3x_3$
模型表示：

参数	含义
n	特征的个数
m	训练集的个数
$x^{(i)}$	第i个训练集实例，矩阵中的第i列，是一个向量
$x^{(i)}_j$	第i个训练实例的第j个值

假设 $x_0=1$ ，则假设函数公式可简化为：

h θ (x) = θ T X = θ 0 x 0 + θ 1 x 1 + . . . + θ n x n

$h\theta(x)=\theta^TX=\theta_0x_0+\theta_1x_1+...+\theta_nx_n$
其中

θT $\theta^T$ 表示矩阵的转置

2. 多变量梯度下降

2.1 代价函数

J (θ 0 θ 1, . . ., θ n) = 1 2 m \sum i = 1 m (h θ (x (i)) - y (i)) 2

$J(\theta_0\theta_1,...,\theta_n)=\frac{1}{2m}\sum^{m}_{i=1}(h\theta(x^{(i)})-y^{(i)})^2$

2.2 梯度下降算法求导

θ j : = θ j - α 1 m \sum i = 1 m ((h θ (x (i)) - y (i)) * x (i) j), j = 0, 1, 2, . . ., n

$\theta_j:=\theta_j-\alpha\tfrac{1}{m}\sum^m_{i=1}((h\theta(x^{(i)})-y^{(i)})*x^{(i)}_j) ,j=0,1,2,...,n$
注意: 必须同时更新

θj $\theta_j$ 的值

3. 特征缩放

在面对多维特征问题时，需要保证这些特征都有相近的尺度，这样能使梯度下降算法能更快的收敛。
尝试将所有的特征尺度缩放到-1~1之间，使用如下公式：其中 $\mu_n$ 为平均值， $s_n$ 为标准差

x n = x n - μ n s n

$x_n=\frac{x_n-\mu_n}{s_n}$

4. 学习率

4.1 如何合理设置 $\alpha$ 的值

可以选择 $\alpha=0.001,0.003,0.01,0.03,0.1,0.3$

4.2 通过画出迭代次数和代价函数图来观察算法何时收敛

这里写图片描述

5. 正规方程(Normal Equation Noninvertibility)

通过求解 $\theta=(X^TX)^{-1}X^Ty$ ，其中X为训练集特征，y为训练集结果，求出代价函数最小的参数 $\theta$ 。注意：对于不可逆的矩阵，正规方程是不可用的。

梯度下降和正规方程的比较

梯度下降	正规方程
需要选择 $\alpha$	不需要
需要多次迭代	一次运算求出结果
当特征量n特别大时也适用	时间复杂度为 $O(n^3)$ ，当n<1000时可以接受
适用于各种模型	只适用于线性模型

Geek-Yan

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Standford 机器学习—第二讲 Linear Regression with multiple variables(多变量线性回归)

Linear Regression with multiple variables – 多变量线性回归1. 假设函数hθ(x)=θ0+θ1x1+θ2x2+θ3x3 h\theta(x)=\theta_0+\theta_1x_1+\theta_2x_2+\theta_3x_3 模型表示：参数含义 n 特征的个数 m 训练集的个数
复制链接

扫一扫