神经网络参数设置注意事项

翻译网上的哈,我觉得有很大一部分从没看到过,所以就翻译了下,如有不对的地方,欢迎指正:

1、准备数据:务必保证有大量、高质量并且带有干净标签的数据,没有如此的数据,学习是不可能的

2、预处理:这个不多说,就是0均值和1方差化

3、minibatch:建议值128,1最好,但是效率不高,但是千万不要用过大的数值,否则很容易过拟合

4、梯度归一化:其实就是计算出来梯度之后,要除以minibatch的数量。这个不多解释

5、下面主要集中说下学习率

  • 总的来说是用一个一般的学习率开始,然后逐渐的减小它
  • 一个建议值是0.1,适用于很多NN的问题,一般倾向于小一点。
  • 一个对于调度学习率的建议:如果在验证集上性能不再增加就让学习率除以2或者5,然后继续,学习率会一直变得很小,到最后就可以停止训练了。
  • 很多人用的一个设计学习率的原则就是监测一个比率(每次更新梯度的norm除以当前weight的norm),如果这个比率在10-3附近,如果小于这个值,学习会很慢,如果大于这个值,那么学习很不稳定,由此会带来失败。

6、使用验证集,可以知道什么时候开始降低学习率,和什么时候停止训练。

7、关于对weight初始化的选择的一些建议:

  • 如果你很懒,直接用0.02*randn(num_params)来初始化,当然别的值你也可以去尝试
  • 如果上面那个不太好使,那么久依次初始化每一个weight矩阵用init_scale / sqrt(layer_width) * randn,init_scale可以被设置为0.1或者1
  • 初始化参数对结果的影响至关重要,要引起重视。
  • 在深度网络中,随机初始化权重,使用SGD的话一般处理的都不好,这是因为初始化的权重太小了。这种情况下对于浅层网络有效,但是当足够深的时候就不行了,因为weight更新的时候,是靠很多weight相乘的,越乘越小,有点类似梯度消失的意思(这句话是我加的)

8、如果训练RNN或者LSTM,务必保证gradient的norm被约束在15或者5(前提还是要先归一化gradient),这一点在RNN和LSTM中很重要。

9、检查下梯度,如果是你自己计算的梯度。

10、如果使用LSTM来解决长时依赖的问题,记得初始化bias的时候要大一点

12、尽可能想办法多的扩增训练数据,如果使用的是图像数据,不妨对图像做一点扭转啊之类的,来扩充数据训练集合。

13、使用dropout

14、评价最终结果的时候,多做几次,然后平均一下他们的结果。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
搭建图像分类神经网络时,需要注意以下几点: 1. 数据预处理:在搭建神经网络之前,需要对图像数据进行预处理,包括图像尺寸的调整、灰度化或彩色化、数据标准化等,以便网络能够更好地处理和学习图像特征。 2. 网络架构选择:选择适合图像分类任务的网络架构,如卷积神经网络(Convolutional Neural Network, CNN),CNN在图像处理领域表现出色。可以使用已经被广泛验证的经典网络结构,如LeNet、AlexNet、VGG、ResNet等,或者根据任务需求自行设计网络结构。 3. 激活函数选择:合适的激活函数能够帮助网络更好地捕捉并表示图像特征,常用的激活函数有ReLU、Sigmoid和Tanh等,根据网络的层数和任务需求选择合适的激活函数。 4. 损失函数选择:选择合适的损失函数来衡量预测输出与真实标签之间的差距,常用的损失函数有交叉熵损失函数(cross-entropy loss)和均方误差损失函数(mean squared error loss)。根据分类任务的特点选择适合的损失函数。 5. 优化算法选择:选择适合的优化算法来更新网络参数,常用的优化算法有随机梯度下降(SGD)、Adam和Adagrad等。根据网络的复杂度和效果选择合适的优化算法。 6. 数据集划分:为了评估网络的性能,需要将数据集划分为训练集、验证集和测试集。训练集用于网络参数的更新,验证集用于调整超参数和网络结构,测试集用于最终评估网络的性能。 7. 正则化:为了防止过拟合,可以采用正则化技术,如L1或L2正则化、Dropout等,以提高网络的泛化能力。 8. 超参数调优:调整网络的超参数,如学习率、批量大小、网络层数等,以获得更好的性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值