零基础入门CV-Task 4 模型训练与验证

最新推荐文章于 2020-12-17 13:33:28 发布

LuZer0

最新推荐文章于 2020-12-17 13:33:28 发布

阅读量183

点赞数

分类专栏： CV比赛

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ZER0ll/article/details/106448704

版权

CV比赛专栏收录该内容

5 篇文章 0 订阅

订阅专栏

在上一章节中我们构建了一个简单的 CNN 进行训练，并可视化了训练过程中的误差损失和第一个字符预测准确率，但这些还远远不够。一个成熟的深度学习训练流程至少具备以下功能：

在训练集上进行训练，并在验证集上进行验证

模型可以保存最优的权重，并读取权重
记录下训练集和验证集的精度，便于调参

为此本章将从构建验证集、模型训练和验证、模型保存与加载和模型调参几个部分讲解，在部分小节中将会结合 PyTorch 代码进行讲解

5.1 学习目标

理解验证集的作用，并使用训练集和验证集完成训练
学会使用 PyTorch 环境下的模型读取和加载，并了解调参流程

5.2 构造验证集

在机器学习模型（特别是深度学习模型）训练过程中，模型是非常容易过拟合的。深度学习模型在不断的训练过程中训练误差会逐渐降低，但测试误差的走势则不一定。

在模型的训练过程中，模型只能利用训练数据来进行训练，模型并不能接触到测试集上的样本。因此模型如果将训练集学的过好，模型就会记住训练样本的细节，导致模型在测试集的泛化效果较差，这种现象称为过拟合（Overfitting）。与过拟合相对应的是欠拟合（Underfitting），即模型在训练集上的拟合效果较差

如图所示：随着模型复杂度和训练轮数的增加，CNN 模型在训练集上的误差会降低，但在测试集上的误差会逐渐降低，然后逐渐升高，二我们的目的是让模型在测试集上的精度越高越好。

导致模型过拟合这种情况的原因有很多，其中最为常见的情况是模型复杂度（Model Complexity）太高，导致模型学习到了训练数据的方方面面，学习到了一些细枝末节的规律。

解决上述问题的办法：构建一个与测试集尽可能分布一致的样本集（可称为验证集），在训练过程中不断验证模型在验证集上的精度，并以此控制模型的训练。

在给定赛题后，赛题方会指定训练集和测试集两部分数据。参赛方需要在训练集上面构建模型，并在测试集上面验证模型的泛化能力。因此参赛者可以通过提交模型对测试集的预测结果，来验证自己模型的泛化能力。同时参赛方也会限制一些提交的次数限制，以此避免参赛选手“刷分”。

在一般情况下，参赛选手也可以自己在本地划分出一个验证集出来，进行本地验证。训练集，验证集和测试集分别有不同的作用：

训练集（Train Set）：模型用于训练和调整参数
验证集（validation Set）：用来验证模型精度和调整模型超参数
测试集（Test Set）：验证模型的泛化能力

因为训练集和验证集是分开的，所以模型在验证集上面的精度在一定程度上可以反映模型的泛化能力。在划分验证集的时候，需要注意验证集的分布应该与测试集尽量保持一致，不然模型在验证集上的精度就失去了意义。

既然验证集这么重要，那么如何划分本地验证集呢。在一些比赛中，赛题方会提供特定的验证集；如果赛题方没有指定验证集，那么参赛选手就需要从训练集中拆分一部分得到验证集。验证集的划分如下几种方式：

留出法
直接将训练计划分成两部分，新的训练集和验证集。这种划分最为简单；缺点是只得到了一份验证集，有可能导致模型在验证集上过拟合。留出法应用场景是数据量比较大的情况下。
交叉验证发
将训练计划分成 K 份，将其中 K-1 份作为训练集，剩余的 1 分作为验证集，循环 k
训练。这猴子那个划分方式是左右训练集都是验证集，最终模型验证精度是 K 份平均得到。这种方式的优点是验证集精度比较可靠，训练 K 次可以得到 K 个有多样性差异的模型；cv 验证的缺点是需要训练 k 次，不适合数据量较大的情况
自主采样法
通过有放回的采样方式得到新的训练集和验证集，每次的训练集和验证集都是有区别的。这种划分方式一般适用于数据量较小的情况。

在本次赛题中已经划分为验证集，因此选手可以直接使用训练集进行训练，并使用验证集进行验证精度（当然你也可以合并验证集和训练集，自行划分验证集）
当然这些划分方法是从数据划分方式角度来讲的，在现有的数据比赛中一般采用的划分方法是留出法和交叉验证法。如果数据量较大，留出法比较合适。防染任何的验证集的划分得到的验证集都是要保证训练集-验证集-测试集分布一致，所以不管以何种的方式划分都是需要注意。
这里的分布一般就是指与标签相关的统计分布，比如在分类任务重“分布”指的是标签的类别分布，训练集-验证集-测试集的类别分布情况应该大体一致；如果标签是带有时序信息，则验证集和测试集的时间间隔应该保持一致

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。