李宏毅深度学习-机器学习任务攻略

最新推荐文章于 2024-05-22 12:36:45 发布

ASHOUR

最新推荐文章于 2024-05-22 12:36:45 发布

阅读量428

点赞数 4

分类专栏：李宏毅-深度学习文章标签：深度学习机器学习人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62200355/article/details/135820062

版权

李宏毅-深度学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

机器学习的基本框架-Framework of ML

训练的三个基本步骤，如上图所示。

我们一般直接跑sample code,往往只能得到baseline的结果，那如何获得更好的结果呢，本节会简略的回答这个问题。

攻略：

如果说你觉得你对自己的训练结果不满意的话，第一步应该先检查你的training data 的loss,如果你的模型在training data上的loss比较大，那么你需要思考这是model bias还是optimization的问题。

model bias:

model bias可能意味着你的模型太过于简单了，以至于最优解根本就不在你model的集合里，这时你或许需要增加更多的特征来使你的model更具有弹性，例如加深网络层数，把20层的网络加深到56层之类的。

另一种可能，你的模型已经足够好了，但是你的优化求解没做好，即你没有找到最优解：例如使用梯度下降法陷入局部最优了

which one?

好的，如果你发现你在training data上的loss已经比较小了，那么你需要查看它在test data上的loss情况如何。

过拟合

如果你发现你的model在training data上的loss比较小，但在test data上的loss很大，那么很可能你的model overfitting也就是过拟合了。

下面举一个过拟合的极端例子：

定义这个函数为，如果输入属于训练集，则输出对应的正确标签，反之则输出随机，这个极端的函数在训练集上的损失为0，但是在测试集上的loss可想而知会非常大。

一般过拟合的情况：

解决过拟合的方法：

可以提供更多的训练数据，更多的训练数据意味着更多的限制，模型弹性变小也就不容易过拟合了

数据增强-Data augmentation:如图我们可以将一张图片作一下变化，例如镜像翻转，放到其中某部分，这不好影响我们识别的结果，但是提供更多的丰富的训练数据。

另外的常用的方法：

模型的弹性：

如图，一般来讲，随着模型复杂度的提升，模型在training data上的loss是会越来越小的，但是一旦模型过于复杂，就会发生overfitting的现象，而我们想要找到则是中间黑线的对应的模型。

更重要的一环-交叉验证

交叉验证-提高model在private上的正确率：

关注

4
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
李宏毅深度学习-机器学习任务攻略

训练的三个基本步骤，如上图所示。我们一般直接跑sample code,往往只能得到baseline的结果，那如何获得更好的结果呢，本节会简略的回答这个问题。攻略：如果说你觉得你对自己的训练结果不满意的话，第一步应该先检查你的training data 的loss,如果你的模型在training data上的loss比较大，那么你需要思考这是model bias还是optimization的问题。
复制链接

扫一扫

专栏目录

ASHOUR CSDN认证博客专家 CSDN认证企业博客

码龄3年

11: 原创

109万+: 周排名

10万+: 总排名

4957: 访问

: 等级

187: 积分

147: 粉丝

72: 获赞

13: 评论

88: 收藏

私信

关注

热门文章

分类专栏

最新评论

学习开源项目FuxiCTR遇到的问题-01-报错 -module ‘yaml‘ has no attribute ‘FullLoader‘
CSDN-Ada助手: 恭喜您写了第8篇博客！看到您在学习开源项目FuxiCTR时遇到的问题，我觉得您的解决问题的能力很强。希望您能继续坚持不懈地写作，分享您的学习经验和心得。下一步，我建议您可以尝试分享一些解决问题的思路和方法，或者是对开源项目的深入分析，这样可以让读者更好地理解您的学习过程，也能够帮助更多有相似问题的人。期待您更多的精彩内容！
推荐系统开源项目FuxiCTR-demo-QuickStart
CSDN-Ada助手: 恭喜您发布了第9篇博客“推荐系统开源项目FuxiCTR-demo-QuickStart”，内容相当精彩！对推荐系统开源项目的分享让读者受益匪浅。希望您能继续保持创作的热情，为大家带来更多有价值的内容。或许在接下来的博客中，可以深入分析FuxiCTR-demo-QuickStart的实际应用场景或者与其他推荐系统开源项目进行对比，让读者更好地了解其特点与优势。期待您的下一篇作品！
推荐系统开源项目FuxiCTR-2-Run a model on tiny data
CSDN-Ada助手: 恭喜您写了第10篇博客！看到您分享了关于推荐系统开源项目FuxiCTR-2的文章，觉得很有意思。不过小伙伴们可能还想看到更多关于这个项目的深入分析和实践经验分享，或者可以考虑探讨一下如何优化模型在大规模数据上的运行效果。希望您能继续保持创作热情，不断提升自己的技术水平，共同探索推荐系统领域的更多精彩内容！
推荐系统开源项目FuxiCTR-Workflow-工作流程
CSDN-Ada助手: 恭喜作者发布第11篇博客，分享了关于推荐系统开源项目FuxiCTR-Workflow的工作流程，内容十分精彩！希望作者能够继续保持创作的热情和耐心，不断分享更多有价值的内容。或许下一步可以深入探讨该项目的应用场景，或者结合实际案例进行演示，让读者更加直观地了解工作流程的实际操作。期待作者的下一篇作品！愿您在创作的道路上越走越远。
李宏毅深度学习-机器学习任务攻略
CSDN-Ada助手: 恭喜您写了第7篇博客，标题“李宏毅深度学习-机器学习任务攻略”，内容看起来非常丰富和有深度。希望您能继续坚持创作，分享更多的知识和经验。或许下一步可以考虑分享一些实际案例或者自己的学习心得体会，这样可以让读者更加深入地理解和应用您所分享的内容。加油！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。