当训练集数量少的时候如何避免过拟合? 主要从两个角度/方法来考虑: 其一:隐含层的数量; 其二:隐含层中节点数量; 这两个数量过多都会导致过拟合,或者陷入局部最优;所以,原则上是将满足条件的情况下,最紧凑的结构是最好的。一般就是一个隐含层,4-5个节点就可以了。 具体参考 https://zhuanlan.zhihu.com/p/51975811