吴恩达机器学习-第二周

最新推荐文章于 2024-04-10 20:24:04 发布

Sansui_Meng

最新推荐文章于 2024-04-10 20:24:04 发布

阅读量91

点赞数

分类专栏：机器学习文章标签：吴恩达机器学习

本文链接：https://blog.csdn.net/qq_42956667/article/details/100799103

版权

机器学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

本周主要内容

1、多变量线性回归

1.1多变量线性回归

指样本有多个特征， $n$ 代表特征数量， $x^{(i)}$ 代表第 $i$ 个训练实例，是特征矩阵中的第 $i$ 行
每个实例有 $n$ 个特征， $x_j^{(i)}$ 代表第 $i$ 个实例中的第 $j$ 个特征。
多变量的假设函数:
$h_\theta(x) = \theta_0+\theta_1x_1+\theta_2x_2+...+\theta_nx_n$
公式中 $n + 1$ 个参数和 $n$ 个变量，为了简化公式，引入 $x_0 =1$ ，则公式转化为：
$h_\theta(x) = \theta_0x_0+\theta_1x_1+\theta_2x_2+...+\theta_nx_n$
多变量的代价函数:
$J(\theta_0,\theta_1,...,\theta_n) = {1\over 2m}\sum_{i=1}^m{(h_\theta(x^{(i)})-y^{(i)})}^2$
多变量的更新参数:
$\theta_j = \theta_j-\alpha\frac{\partial }{\partial \theta_j}J(\theta)= {1\over m}{\sum_{i=1}^m}{(h_\theta(x^{(i)})-y^{(i)})x^{(i)}_j}$
梯度下降的过程与单变量是一样的：详见吴恩达机器学习-第一周

1.2特征缩放

如果特征值尺度不同，会出现如图的情况，这样进行梯度下降的次数会大大增加。对比图
为了减少梯度下降的迭代次数，一般对特征值的尺度进行缩放。基本方法为：
$\longrightarrow x_n = {{x_n-\mu_n}\over s_n},\mu_n为平均值，s_n为标准差$
$(2)\longrightarrow x_n = {{x_n-\mu_n}\over x_{max}-x_{min}}$
一般通常特征的尺度控制在： $-3\sim3$ 和 $-{1\over3}\sim {1\over3}$

1.2学习率

迭代次数和代价函数
图中函数为梯度下降迭代次数和代价函数的值的曲线

梯度下降算法每次迭代受学习率的影响:

$\alpha$ 过小，收敛迭代次数高；

$\alpha$ 过大，每次迭代可能不会减少代价函数，可能越过局部最小值。

通常可考虑的值有：
$α = 0.01 ， 0.03 ， 0.1 ， 0.3 ， 1 ， 3 ， 10$

2、正规方程

正规方程的主要实现方法就是对代价函数求导，取使导数为 $0$ 时候 $\theta$ 的值。
正规方程公式：
$\theta = (X^TX)^{-1}X^Ty$

梯度下降与正规方程的对比：对比图

3、向量化

向量化将使计算更为简单。

Sansui_Meng

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
吴恩达机器学习-第二周

本周主要内容1、多变量线性回归1、多变量线性回归指样本有多个特征，nnn代表特征数量，x(i)x^{(i)}x(i)代表第iii个训练实例，是特征矩阵中的第iii行每个实例有nnn个特征，xj(i)x_j^{(i)}xj(i)代表第iii个实例中的第jjj个特征。多变量的的假设函数:hθ(x)=θ0+θ1x1+θ2x2+...+θnxnh_\theta(x) = \th...
复制链接

扫一扫

专栏目录