机器学习心得（二）

啥都会一点的攻城狮

已于 2022-04-02 09:41:16 修改

阅读量1k

点赞数 1

文章标签：机器学习

于 2022-04-02 09:36:17 首次发布

本文链接：https://blog.csdn.net/qq_43583123/article/details/123912147

版权

6 篇文章 2 订阅

订阅专栏

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

前言

梯度下降顾名思义就是不停的向下推进，比如，我们正在山顶现在需要快速回到山下，那么我们就需要找到一条安全且可靠的路下山，我们每走一步就会看一眼。如下图所示：在这里插入图片描述

梯度下降的每一步中，都用到了所有的训练样本，公式如下：
$w_{j}=w_{j}-\alpha \frac{1}{m}\sum_{i=1}^{m}((h(x^{(i)})-y^{(i)})x^{(j)})$ ，其中 $h(x^{(i)})-y^{(i)})x^{(j)})$ 为梯度， $\alpha$ 为学习率

梯度下降的每一步中，用到了一定批量的训练样本每计算常数𝑏次训练实例，便更新一次参数 $w$ ，公式如下
$w_{j}=w_{j}-\alpha \frac{1}{b}\sum_{k=i}^{i+b-1}(h(x^{(k)})-y^{(k)})x_{j}^{(k)}$
当𝑏=1（随机梯度下降,SGD）
当𝑏=m（批量梯度下降,BGD）
当𝑏=batch_size，通常是2的指数倍，常见有32,64,128等。(小批量梯度下降,MBGD)

为什么要归一化/标准化？
提升模型精度：不同维度之间的特征在数值上有一定比较性，可以大大提高分类器的准确性。
加速模型收敛：最优解的寻优过程明显会变得平缓，更容易正确的收敛到最优解。
归一化：数据归一化的目的是使得各特征对目标变量的影响一致，会将特征数据进行伸缩变化，所以数据归一化是会改变特征数据分布的，能将数据映射到[0,1]之间。归一化公式如下： $x^{*}=\frac{x-x_{min}}{x_{max}-x_{min}}$
标准化：数据标准化为了不同特征之间具备可比性，经过标准化变换之后的特征数据分布没有发生改变。就是当数据特征取值范围或单位差异较大时，最好是做一下标准化处理。处理后的数据均值为0，方差为1.公式如下： $x^{*}=\frac{x-\mu }{\sigma }$