Tensorflow下对RNN中Batch-size的测试和理解

最新推荐文章于 2024-06-25 10:33:00 发布

风谨_

最新推荐文章于 2024-06-25 10:33:00 发布

阅读量5.8k

点赞数

分类专栏：学习笔记文章标签： tensorflow batch-size

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TianxiaoV/article/details/78539339

版权

本文探讨了在TensorFlow1.4版本下，RNN中Batch-size的增减对模型训练的影响。增大Batch-size可以提高内存利用率和矩阵乘法效率，但可能导致内存不足，并增加达到相同精度所需的时间。过大的Batch-size可能会导致下降方向稳定，减慢参数修正。测试表明，Batch-size的选择对收敛速度有显著影响，特别是在初始阶段，随机选取的批处理数据会影响梯度方向。

摘要由CSDN通过智能技术生成

这篇笔记是基于tensorflow1.4版本，小白级别。代码是在网上下载的一个做mnist手写数字分类的LSTM，修改了两个小地方。

    x = tf.split(x, n_steps, 0)
    cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y, logits=pred))

- Batch-size

增大 Batch_Size 有何好处？
内存利用率提高了，大矩阵乘法的并行化效率提高。跑完一次 epoch（全数据集）所需的迭代次数减少，对于相同数据量的处理速度进一步加快。在一定范围内，一般来说 Batch_Size 越大，其确定的下降方向越准，引起训练震荡越小。
盲目增大 Batch_Size

最低0.47元/天解锁文章

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

风谨_ CSDN认证博客专家 CSDN认证企业博客

码龄10年

20: 原创

18万+: 周排名

170万+: 总排名

8万+: 访问

: 等级

904: 积分

42: 粉丝

24: 获赞

18: 评论

135: 收藏

私信

关注

热门文章

分类专栏

最新评论

3. 类指针与智能指针
CSDN-Ada助手: 非常感谢CSDN博主的分享，这篇博客对于我们理解类指针与智能指针的区别与使用非常有帮助。我觉得下一篇博客可以继续探讨C++中的内存管理，特别是关于内存泄漏和内存溢出的问题，以及如何使用智能指针来解决这些问题。这样的技术文章对其他用户也会非常有帮助，期待您的下一篇博客！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
3. 类指针与智能指针
qq_40110346: "对象在生命周期结束后会自动盗用析构函数释放内存" 为啥要盗呢,难道调不如偷?!
PCA降维MATLAB使用案例
陌紫: 我想请教一下，这个最后结论，有没有文章出处
PCA降维MATLAB使用案例
陌紫: 我想请教一下，这个最后结论，并不是取得维数越多效果越好
PCA降维MATLAB使用案例
Laughing bird: 您好，请问矩阵大小为501*1000的样本，使用您的方法之后当维数为100时，精度为95%，那么，我只能降到501*100嘛？还可以再降嘛？就是在501这个维度上降，还能嘛？

大家在看

【快速上手】linux环境下Neo4j的安装与使用

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。