深度学习笔记（二）：2优化算法（一）Mini-batch和指数加权平均数

最新推荐文章于 2022-06-28 18:25:08 发布

还好江南

最新推荐文章于 2022-06-28 18:25:08 发布

阅读量898

点赞数

分类专栏：深度学习笔记文章标签：深度学习数据挖掘神经网络 tensorflow 算法

本文链接：https://blog.csdn.net/weixin_42503072/article/details/104941637

版权

Mini-batch

Mini-batch是一个一次训练数据集的一小部分，而不是整个训练集的技术。它可以使内存较小、不能同时训练整个数据集的电脑也可以训练模型。
Mini-batching 从运算角度来说是低效的，因为你不能在所有样本中计算 loss。但是这点小代价也比根本不能运行模型要划算。它跟随机梯度下降（SGD）结合在一起用也很有帮助。
方法是在每一代训练之前，对数据进行随机混洗，然后创建 mini-batches，对每一个 mini-batch，用梯度下降训练网络权重。因为这些 batches 是随机的，你其实是在对每个 batch 做随机梯度下降（SGD）。
假设 mini-batch 大小为 1，就有了新的算法，叫做随机梯度下降法，每个样本都是独立的 mini-batch，当你看第一个 mini-batch，也就是𝑋{1}和𝑌{1}，如果 mini-batch 大小为 1，它就是你的第一个训练样本，这就是你的第一个训练样本。接着再看第二个mini-batch，也就是第二个训练样本，采取梯度下降步骤，然后是第三个训练样本，以此
类推，一次只处理一个。
首先，如果训练集较小，直接使用 batch 梯度下降法，样本集较小就没必要使用 mini-batch 梯度下降法，你可以快速处理整个训练集，所以使用 batch 梯度下降法也很好，这里的少是说小于 2000 个样本，这样比较适合使用 batch 梯度下降法。不然，样本数目较大的话，一般的 mini-batch 大小为 64 到 51

最低0.47元/天解锁文章

还好江南

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
深度学习笔记（二）：2优化算法（一）Mini-batch和指数加权平均数

Mini-batchMini-batch是一个一次训练数据集的一小部分，而不是整个训练集的技术。它可以使内存较小、不能同时训练整个数据集的电脑也可以训练模型。Mini-batching 从运算角度来说是低效的，因为你不能在所有样本中计算 loss。但是这点小代价也比根本不能运行模型要划算。它跟随机梯度下降（SGD）结合在一起用也很有帮助。方法是在每一代训练之前，对数据进行随机混洗，然后创...
复制链接

扫一扫