caffe中batchsize的选择

最新推荐文章于 2023-11-30 20:02:29 发布

seashell_9

最新推荐文章于 2023-11-30 20:02:29 发布

阅读量2.2k

点赞数

分类专栏： caffe 文章标签： caffe

本文链接：https://blog.csdn.net/seashell_9/article/details/66973386

版权

caffe 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

来自 https://github.com/BVLC/caffe/issues/430：

这里的意思就是batchsize和学习率是相关的，如果batchsize减小了X倍，则理论上学习率应增大sqrt(X)倍（当然这是找到最好的batchsize的情况下的），不过Alex还是用了X倍。后面 https://arxiv.org/abs/1404.5997 这个链接的论文还没看，有时间的可以看一下，好像有专门讲到batchsize的设置的

另外，batchsize最好设置为8的倍数，这样gpu的并行运算效率最高

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

seashell_9

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
caffe中batchsize的选择

来自 https://github.com/BVLC/caffe/issues/430：这里的意思就是batchsize和学习率是相关的，如果batchsize减小了X倍，则学习率应增大sqrt(X)倍，当然这是找到最好的batchsize的情况下的
复制链接

扫一扫