关注“迈微AI研习社”,内容首发于公众号
最近,一位来自伯克利的小哥Josh Robin分享了他的深度学习debug心得,从最简单模型开始一步步深入到复杂模型,希望能给刚上手的你一点帮助。
为什么别人的模型都能快速达到较低的错误率,而你的模型错误率却居高不下。

造出这种现象的原因可以分为4大类:
-
模型实现中的bug:比如标签错误的问题。
-
超参数选择不合适:模型对超参数很敏感,学习率太高或太低都不行。
关注“迈微AI研习社”,内容首发于公众号
最近,一位来自伯克利的小哥Josh Robin分享了他的深度学习debug心得,从最简单模型开始一步步深入到复杂模型,希望能给刚上手的你一点帮助。
为什么别人的模型都能快速达到较低的错误率,而你的模型错误率却居高不下。
造出这种现象的原因可以分为4大类:
模型实现中的bug:比如标签错误的问题。
超参数选择不合适:模型对超参数很敏感,学习率太高或太低都不行。