Datawhale X 李宏毅苹果书 AI夏令营实践方法论

最新推荐文章于 2024-09-29 12:53:41 发布

交流成就自我

最新推荐文章于 2024-09-29 12:53:41 发布

阅读量271

点赞数 3

文章标签：机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Lin_WuB/article/details/141823246

版权

Datawhale X 李宏毅苹果书 AI夏令营

实践方法论

问题1：训练数据损失大

对于这个问题，存在两种可能：1、模型的灵活性不够 （大海里没有针） 2、梯度下降不给力 （针找不到）

可能1：模型偏差

现象

模型偏差 ——> 所以的损失都过大。

对于算出来的损失，均是较大的值，若不进行优化，则是矮子里面挑高个，所得到的模型 灵活性不够

在这里插入图片描述

解决方法

增加特征数量
设计一个更大的模型
使用深度学习

在这里插入图片描述

可能2：优化问题

这个是 梯度下降 这一算法本身存在的问题。

梯度下降 是一个 解优化 的过程，即在给定的范围内寻找损失最小的解，找到便停止。

因此便会出现：局部最小 、 找不到最小 等问题

判断方法

先做一个 浅一点 简单一点 的模型，看看它们的损失是什么样的，然后再训练 深度的模型 ，并将二者的损失进行对比。

如果 深模型 损失比 简单模型 要大，那就是 优化不好
- 因为深模型的灵活性已经够了，不可能是灵活性上的问题

问题2：测试数据损失大

过拟合

训练数据 的损失较小，但是 测试数据 的损失大的情况

原因：

训练集的数据太小了，给模型的限制性不够。在其他没有训练集的地方，模型的灵活性很大，可以是任何函数，产生各种各样的结果

在这里插入图片描述

解决方法

（1）增加数据集/做数据增强

给定更多的数据，以此来达到限制模型的效果

数据增强就是根据问题的理解创造出新的数据。但要根据对数据的特性以及要处理的问题的理解，来选择合适的数据增强的方式。

（2）给模型限制

给模型 比较少的参数 或者 让模型共用参数 ，如 卷积神经网络
给定较少的特征
比如早停、 正则化 、 丢弃法

交叉验证

比较合理选择模型的方法是把训练的数据分成两半，一部分称为 训练集 ，一部分是验证集 。比如 90% 的数据作为训练集，有 10% 的数据作为验证集。

不匹配

不匹配是指训练集跟测试集的分布不同，训练集再增加其实也没有帮助了。如下图的2/26

在这里插入图片描述

我们对训练集跟测试集的产生方式有一些理解，才能判断是不是出现了不匹配的问题。

交流成就自我

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。