Datawhale X 李宏毅苹果书 AI夏令营--深度学习入门 Task3

Datawhale X 李宏毅苹果书 AI夏令营–深度学习入门 Task3

实践方法论,分析训练模型时可能遇到的问题

模型偏差

模型过于简单,让损失变低的函数不在模型可以描述的范围

重新设计一个模型,给模型更大的灵活性,可以增加输入的特征(案例的一天增加为七天),也可以用深度学习

image-20240903105816845

优化问题

梯度下降可能会卡在局部最小值,相较于模型偏差,目标函数在模型范围内,但没找到

当训练数据的损失不够低时,要确定是否是优化问题

  • 通过比较不同的模型来判断模型现在到底够不够大,如56层的损失比20层的损失大,代表56层网络的优化没做好,否则是模型偏差

  • 看到一个从来没有做过的问题,可以先跑一些比较小的、比较浅的网络,或甚至用一些非深度学习的方法,比如线性模型、支持向量机,它们比较不会有优化失败的问题,借此先知道这些简单的模型可以得到什么样的损失,如果深的模型跟浅的模型比起来,深的模型明明灵活性比较大,但损失却没有办法比浅的模型压得更低,代表说优化有问题,要选择其他更优算法

  • 如果是模型偏差,就把模型变大。假设经过努力可以让训练数据的损失变小,接下来可以来看测试数据损失;如果测试数据损失也小,比这个较强的基线模型还要小,就结束了

  • 过拟合是训练数据上损失小,测试数据损失大,而优化问题通常是训练数据上表现不佳

  • 在测试上的结果不好,不一定是过拟合。要把训练数据损失记下来,先确定优化没有问题,模型够大了,接下来才看看是不是测试的问题,如果是训练损失小,测试损失大,这个有可能是过拟合

过拟合

解决过拟合

  • 通常最有效的方向是增加训练集,因为过拟合是模型在训练数据之外的地方灵活度过大,过于随意

    • 数据增强:根据问题的理解创造出新的数据,例如将一张图片左右翻转,或截取放大,但不能随便乱做,如上下颠倒可能会产生奇怪的图像
  • 另外一个解法是给模型一些限制,让模型不要有过大的灵活性,在选择函数的时候注意制造限制

    • 给模型比较少的参数:如果是深度学习的话,就给它比较少的神经元的数量,或者让模型共用参数,可以让一些参数有一样的数值

      全连接网络是一个比较有灵活性的架构,卷积神经网络CNN是一种比较没有灵活性的模型,其是针对图像的特性来限制模型的灵活性

    • 用比较少的特征,如将3天改为2天

    • 早停,正则化,丢弃法

    • 限制太大会导致模型偏差

image-20240903155802361

  • 比较复杂的模型包含的函数比较多,参数比较多
  • 选太复杂的就过拟合,选太简单的有模型偏差的问题
  • 当复杂的程度,超过某一个程度以后,测试损失就会突然暴增,出现过拟合
  • 不要用公开的测试集调模型,这会让该测试集不能再发挥测试作用,可能会在私人测试集上面得到很差的结果
  • 极端情况:假设有 1 到 1012 个模型,训练集里面有的数据就把它记下来,训练集没看过的,就直接输出随机的结果,测试时其中一个随机的结果刚好匹配测试数据
交叉验证

比较合理选择模型的方法是把训练的数据分成两半,一部分称为训练集,一部分是验证集,但如果随机分验证集,可能会分得不好,分到很奇怪的验证集,会导致结果很差

  • k 折交叉验证就是先把训练集切成 k 等份
  • 例如,训练集切成 3 等份,切完以后,拿其中一份当作验证集,另外两份当训练集,这件事情要重复 3 次。即第一次第1、2 份当训练,第 3 份当验证;第二次第1、3 份当训练,第 2 份当验证;第三次第 2、3 份当训练,第1份当验证
不匹配

不匹配是指训练集和测试集分布不同,例如用2020年训练,2021年测试;普通周训练,带节假日的周测试。要判断这种情况,需要对训练集和测试集的产生有一定了解

  • 11
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

if 1

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值