11. 模型选择+过拟合&&欠拟合【动手学深度学习v2】

hei_hei_hei_

于 2022-06-11 12:10:33 发布

阅读量153

点赞数

分类专栏：学习笔记文章标签：深度学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hei_hei_hei_/article/details/125231859

版权

学习笔记专栏收录该内容

13 篇文章

订阅专栏

笔记源于：李沐老师的视频讲解

1. 模型选择

误差
- 训练误差：模型在训练数据上的误差
- 测试误差：在测试数据上的误差，也叫泛化误差
数据集
- 训练数据集：用于训练模型参数
- 验证数据集：用于评估模型的好坏。调参使用
- 测试数据集：用于测试，只用一次
K-则交叉验证
将训练数据集分为k份，选其中一份作为验证集，剩下作为训练集，循环k次不同的验证集。以k次的均值作为最终的精度衡量
- 在没有足够多的数据时使用。
- K一般取5或10，数据集小的情况K取值较大；反之可以小一点
固定验证集
从训练集中拨出一部分数据作为验证集进行调参。数据集通常采用8-1-1作为训练-验证-测试
参数选择
对于多个参数，通常使用网格搜索（选择组合），更为普遍的做法是固定其余参数对剩下的一个参数进行调整

2. 过拟合&&欠拟合

在这里插入图片描述
模型容量越高，模型就越复杂，能够拟合的事物（曲面）就越复杂，能力越强；反之越简单，例如线性模型。

模型容量：表示拟合各种函数的能力。低容量的模型难以拟合训练数据；高容量的模型能够记住所有训练数据
模型容量与误差之间的关系

训练误差随着模型容量升高而降低，因为模型越复杂能够记住的训练样本越多，训练本身是让模型在训练样本上进行优化。而测试误差在模型复杂到一定的程度之后逐渐上升。这里的泛化gap通常用来衡量模型是否过拟合。
核心任务：降低泛化误差以及降低gap。过拟合本身并不是一件很差劲的事情，一般来讲我们需要模型有一定的能力（足够大），然后通过一定的手段控制模型的容量
模型容量的估计
- 难以在不同种类算法之间比较。例如树模型和神将网络
- 对于固定种类模型，估计模型容量的两个因素：参数的个数；参数值的选择范围
数据复杂度衡量（相对直观概念）
- 样本个数
- 样本元素个数
- 样本的时间、空间结构（例如视频）
- 数据多样性（例如类别）

小结：模型容量需要匹配数据复杂度。

博客等级

码龄7年

94
原创

52
点赞

324
收藏

36
粉丝

关注

私信

热门文章

分类专栏

diffusion model 2篇
论文阅读 27篇
各种出错 5篇
刷题
pytorch 5篇
Python 4篇
学习笔记 13篇
杂集 4篇
NLP 1篇
GNN 2篇
c++常用操作 1篇
蓝桥杯 2篇
csp 17篇
PAT甲级 3篇
并查集 1篇

最新评论

model.eval() && with torch.no_grad()
20170202: 反向传播之后才能计算梯度，第一部分写的有问题
论文阅读【SWINBERT: End-to-End Transformers with Sparse Attention for Video Captioning】
正在学习的劳李: sparse attention mask 相当于没讲啊，原论文也是这样，具体解析没有
深度学习笔记
十六钧: 总结的好棒，受益匪浅！收藏了！
stable diffusion其他微调方法
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/615865688。
【论文阅读】ControlNet
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。