Tensorflow下对RNN中Batch-size的测试和理解

本文探讨了在TensorFlow1.4版本下,RNN中Batch-size的增减对模型训练的影响。增大Batch-size可以提高内存利用率和矩阵乘法效率,但可能导致内存不足,并增加达到相同精度所需的时间。过大的Batch-size可能会导致下降方向稳定,减慢参数修正。测试表明,Batch-size的选择对收敛速度有显著影响,特别是在初始阶段,随机选取的批处理数据会影响梯度方向。
摘要由CSDN通过智能技术生成

这篇笔记是基于tensorflow1.4版本,小白级别。代码是在网上下载的一个做mnist手写数字分类的LSTM,修改了两个小地方。

    x = tf.split(x, n_steps, 0)
    cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y, logits=pred))

- Batch-size

增大 Batch_Size 有何好处?
内存利用率提高了,大矩阵乘法的并行化效率提高。跑完一次 epoch(全数据集)所需的迭代次数减少,对于相同数据量的处理速度进一步加快。在一定范围内,一般来说 Batch_Size 越大,其确定的下降方向越准,引起训练震荡越小。
盲目增大 Batch_Size

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值