深度学习笔记（十一）—— 完整性检查[Sanity Checks]

最新推荐文章于 2025-04-03 14:41:37 发布

zeeq_

最新推荐文章于 2025-04-03 14:41:37 发布

阅读量3.8k

点赞数 4

分类专栏： CS231n课程笔记文章标签：网络深度学习神经网络机器学习

原文链接：https://cs231n.github.io/neural-networks-3/

版权

CS231n课程笔记专栏收录该内容

27 篇文章

订阅专栏

这是深度学习笔记第十一篇，完整的笔记目录可以点击这里查看。

在进行高运算量的网络优化之前，可以先考虑进行以下几个检验：

1. Look for correct loss at chance performance

当使用少量参数进行初始化时，请确保得到了预期的损失。最好先单独检查数据损失（将正则化强度设置为零）。例如，对于具有Softmax分类器的CIFAR-10，我们期望初始损失为2.302，因为我们期望每个类的扩散概率为0.1（因为有10个类），并且Softmax损失是正确类的负对数概率，所以：-ln(0.1)=2.302。如果检验时没有获得预期损失，那么初始化可能会出现问题。

2. Increasing the regularization strength should increase the loss

经过上一步的初次检验后，增加正则化强度时，损失（loss）也应该随之增加

3. Overfit a tiny subset of data

最后也是最重要的一点，在对完整数据集进行训练之前，试着先对数据的一小部分（例如20个样本）进行训练，并确保可以实现损失（loss）为0。对于这个实验，最好将正则化设置为零，否则会影响你获得0损失。如果没有通过这个检验，则该网络模型就不值得继续使用完整的数据集进行训练。

*本博客翻译总结自CS231n课程作业网站，该网站需要翻墙才能访问。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。