Mini-batch梯度下降法

最新推荐文章于 2024-06-30 10:44:35 发布

不爱写程序的程序猿

最新推荐文章于 2024-06-30 10:44:35 发布

阅读量1.1k

点赞数 3

分类专栏： AI 文章标签：深度学习算法机器学习人工智能随机梯度下降

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45870904/article/details/114047582

版权

AI 专栏收录该内容

25 篇文章 0 订阅

订阅专栏

文章目录

- - 其与传统batch gradient descent的比较
  - 选择mini-batch的size

在这里插入图片描述

在大数据时代，数据量很大，如果我们每次都进行基于整个训练集的batch gradient descent 也就是批梯度下降会使得计算时间变得很长

所以我们研究出了一种新的算法 mini-batch algorithm 其简单来说，就是将训练集拆分成n个mini-batch再进行分别处理，而不再是同时处理X和Y集

对训练集的拆分用 $X^{\{t\}}$ 表示
在这里插入图片描述

经过拆分后，一次遍历训练集可以做t次梯度下降.

其与传统batch gradient descent的比较

在这里插入图片描述

可以看到，mini-batch的迭代会出现更多的noisy
后面博客会讲到可以使用动量梯度下降优化这个问题

选择mini-batch的size

在这里插入图片描述

极端情况

若将size设为m 那么就是 batch gradient descent
若将size设为1 那么就是随机梯度下降

将mini-batch size的值设在两者的中间会使优化速度达到最快，因为既利用了向量化的优势，训练集也相对来说没有那么大，能够在一个训练集中实现 m/size 次梯度下降

在这里插入图片描述

一般来说，我们的选择都是2的n次方作为mini-batch 的size ，根据实验证明，这样的选择会更加具有普适性，但一般来说，size的选择需要匹配cpu/Gpu的内存，否则算法性能也会表现的很差.

不爱写程序的程序猿

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Mini-batch梯度下降法

在大数据时代，数据量很大，如果我们每次都进行基于整个训练集的batch gradient descent 也就是批梯度下降会使得计算时间变得很长所以我们研究出了一种新的算法 mini-batch algorithm 其简单来说，就是将训练集拆分成n个mini-batch再进行分别处理，而不再是同时处理X和Y集对训练集的拆分用 X{t}X^{\{t\}}X{t} 表示经过拆分后，一次遍历训练集可以做t次梯度下降.其与传统batch gradient descent的比较可以.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。