过拟合处理方法:
早停
正则化
dropout
数据增广
避免局部极小值方法:
- 以不同的初始值来训练网络,最终选取最小的。
- 使用模拟退火技术。模拟退火在每一步都以一定的概率接受比当前解更差的结果,从而有助于跳出局部极小。在每一步迭代过程中,接受次优解的概率要随着时间的推移而逐渐降低,从而保证算法稳定。
- 使用随机梯度下降。与标准梯度下降精确计算梯度不同,随机梯度下降算法在计算梯度时加入了随机因素。于是,即使陷入局部极小值,它计算的梯度仍有可能不为零,这样就有机会跳出局部极小。
需要注意的是:以上算法大多是启发式方法,理论上缺乏保障。
Must know Tips/Tricks in deep neural networks:
数据增广
图像的预处理
网络的初始化
训练时的技巧
激活函数的选择
不同的正则化
从数据中的发现
同时使用多个神经网络的方法