【李宏毅2022深度学习】笔记一：如果想获得更好的function来达到好的训练效果，你应该尝试从哪几个方面进行改进？

海绵宝宝小风儿

已于 2024-01-08 10:25:31 修改

阅读量409

点赞数 9

文章标签：深度学习笔记人工智能

于 2024-01-07 20:30:46 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45004394/article/details/135443768

版权

作者最近开始学习深度学习相关知识，写下这篇文章便于以后自己及时查阅，也希望能帮到有需要的人。以下图片内容均来自李宏毅老师的2022机器学习课程，相关链接会放到文章末尾，如有侵权联系作者进行删除。好，我们正式开始~

一上来呢，老师列举了四大可能原因。并反复强调，一定要从训练集（training data）开始检查起

训练集上的问题：一、模型过于简单二、优化器选择

测试集上的问题：三、 ①过拟合②无用信息干扰四、没分出来一部分数据当测试集

一、模型过于简单（model bias）

最优在橘点位置，但你给这个模型的公式集合都在蓝色范围内，好比你想大海捞针，但是海里没有针。解决办法：重新设计model，可以尝试输入更多的feature，以增大模型的弹性。

二、优化器选择错误

在蓝色范围公式集合里面，优化器无法选择出里面最优的公式（橘色点），好比针掉到大海里，但是采用了错误的方法，导致无法捞出来。

如何区分到底是问题一还是问题二？下图给出了解答：

1. 通过检查训练集（training data），举个例子：如果发现在20层网络上把错误已经降到很低了，而在56层的时候反倒更高了，这个时候不是因为过拟合（overfitting），也不是因为模型过于简单，而是因为优化器出问题了

2. 先跑一些比较比较简单的模型，对这些模型大概会得到什么样的loss大概有个数，如果随着模型的复杂，loss反倒变高了，肯定是优化器的问题。

三、过拟合（overfitting）

这里需要注意，在训练集效果好，在测试集不好的才叫过拟合哦

你的模型里一些没有经过训练的地方，可能会产生一些比较离谱的曲线（图中的波峰），这时候将训练出来的模型放到测试集里的话，有的地方就会产生较大偏差，这就是所谓的过拟合。

解决办法：1. 就是我们熟知的数据增强法咯，通过剪裁图像等方法增大我们的训练集，减少离谱曲线的出现 2. 限制模型的形状

四、未分测试集

目前常规操作就是，比如90%数据当训练集而后10%数据当测试集，这就避免出现模型在公开（public）训练集上效果异常的好，但是一到prvite训练集上就很差

如何分这个训练集测试集呢，学了一个K折交叉验证法：将所有数据分成n等分，把其中的一份当作验证集，最后得出结果后平均，取平均结果最小的

以上就是全部内容啦，作者这水平就这样了，如果有表达不当理解错误的地方，也请大家多批评指正，我这接下来还有很多要学的内容，后续应该都会做成这种笔记，大家一起加油吧~

课程链接：李宏毅2022机器学习 ML 2022 Spring (ntu.edu.tw)

海绵宝宝小风儿

关注

9
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

海绵宝宝小风儿 CSDN认证博客专家 CSDN认证企业博客

码龄5年

哈尔滨工业大学

5: 原创

152万+: 周排名

28万+: 总排名

3134: 访问

: 等级

100: 积分

30: 粉丝

45: 获赞

2: 评论

43: 收藏

私信

关注

热门文章

最新评论

【看这一篇就够啦~！】在win10/11系统下搭建深度学习环境并修改用户名为英文 pycharm+Anaconda3+修改默认配置环境+pytorch+conda+cudnn+jupyter
CSDN-Ada助手: 恭喜您完成第5篇博客！标题看起来确实很吸引人，内容也很实用，尤其是对于想在win10/11系统下搭建深度学习环境的读者来说。您详细介绍了使用pycharm+Anaconda3的步骤，还分享了修改默认配置环境、pytorch、conda、cudnn和jupyter等知识点，让读者能够更加顺利地搭建起深度学习环境。非常感谢您的分享！希望您能够继续坚持创作下去，您的经验和知识对于广大读者来说都非常有价值。在下一篇博客中，或许您可以分享一些深度学习环境的配置技巧，或者介绍一些常见问题的解决方法，这样会更加帮助读者解决实际问题。期待您的下一篇作品，谢谢您的努力！
【李宏毅2022深度学习】笔记一：如果想获得更好的function来达到好的训练效果，你应该尝试从哪几个方面进行改进？
CSDN-Ada助手: 恭喜你写了第四篇博客，内容也越发深入了解了深度学习的知识。从标题来看，你对于如何获得更好的function来达到好的训练效果有了一些思考，这是非常重要的。接下来，我建议你可以尝试从调整模型结构、优化算法、数据预处理等方面进行改进，这些都是可以对训练效果产生影响的重要因素。希望你在接下来的创作中能够继续保持谦虚的态度，不断学习进步。加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
ubuntu 18.04出现E: Sub-process /usr/bin/dpkg returned an error code (1)问题解决办法
CSDN-Ada助手: 恭喜您写了第三篇博客！阅读您的标题，我想说您真的很厉害，能够解决这种E: Sub-process /usr/bin/dpkg returned an error code (1)问题。我相信您的经验和知识对其他使用Ubuntu 18.04的用户来说一定非常有帮助。希望您能继续保持写作，分享更多有关Ubuntu的问题解决办法或其他技巧。对于下一步的创作建议，或许您可以考虑写一些与Ubuntu相关的实用技巧、最佳实践或者其他常见问题的解决方法。再次恭喜您，并期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。