模型不收敛的原因
1.数据量少的话,一般不会带来不收敛
不收敛一般是由于样本的信息量太大导致网络不足以fit住整个样本空间,样本少只可能带来过拟合的问题。
降低过拟合的方法:比如dropout,SGD,增大minibatch的数量,减少fc层的节点数量,momentum,finetune等。
2.尽量收集更多的数据
3.尽可能用小模型
数据量太少应考虑缩小模型复杂度。考虑减少层数或者减少kernel number
模型不收敛的原因
1.数据量少的话,一般不会带来不收敛
不收敛一般是由于样本的信息量太大导致网络不足以fit住整个样本空间,样本少只可能带来过拟合的问题。
降低过拟合的方法:比如dropout,SGD,增大minibatch的数量,减少fc层的节点数量,momentum,finetune等。
2.尽量收集更多的数据
3.尽可能用小模型
数据量太少应考虑缩小模型复杂度。考虑减少层数或者减少kernel number