前几次模型预测验证集时,loss出现nan。初始学习率为0.1,下调后依旧是NaN。
根据网上资料,以及后续实验,得到两种解决办法。
1.扩大验证集图片数目。
2.减小batch size 大小。开始时实验设为16,后续改为8。
原理还没搞清楚。。。
前几次模型预测验证集时,loss出现nan。初始学习率为0.1,下调后依旧是NaN。
根据网上资料,以及后续实验,得到两种解决办法。
1.扩大验证集图片数目。
2.减小batch size 大小。开始时实验设为16,后续改为8。
原理还没搞清楚。。。