零基础入门CV-Task 4 模型训练与验证

在上一章节中我们构建了一个简单的 CNN 进行训练,并可视化了训练过程中的误差损失和第一个字符预测准确率,但这些还远远不够。一个成熟的深度学习训练流程至少具备以下功能:

  1. 在训练集上进行训练,并在验证集上进行验证
  1. 模型可以保存最优的权重,并读取权重
  2. 记录下训练集和验证集的精度,便于调参

为此本章将从构建验证集、模型训练和验证、模型保存与加载和模型调参几个部分讲解,在部分小节中将会结合 PyTorch 代码进行讲解

5.1 学习目标

  1. 理解验证集的作用,并使用训练集和验证集完成训练
  2. 学会使用 PyTorch 环境下的模型读取和加载,并了解调参流程

5.2 构造验证集

在机器学习模型(特别是深度学习模型)训练过程中,模型是非常容易过拟合的。深度学习模型在不断的训练过程中训练误差会逐渐降低,但测试误差的走势则不一定。

在模型的训练过程中,模型只能利用训练数据来进行训练,模型并不能接触到测试集上的样本。因此模型如果将训练集学的过好,模型就会记住训练样本的细节,导致模型在测试集的泛化效果较差,这种现象称为过拟合(Overfitting)。与过拟合相对应的是欠拟合(Underfitting),即模型在训练集上的拟合效果较差

如图所示:随着模型复杂度和训练轮数的增加,CNN 模型在训练集上的误差会降低,但在测试集上的误差会逐渐降低,然后逐渐升高,二我们的目的是让模型在测试集上的精度越高越好。

导致模型过拟合这种情况的原因有很多,其中最为常见的情况是模型复杂度(Model Complexity)太高,导致模型学习到了训练数据的方方面面,学习到了一些细枝末节的规律。

解决上述问题的办法:构建一个与测试集尽可能分布一致的样本集(可称为验证集),在训练过程中不断验证模型在验证集上的精度,并以此控制模型的训练。

在给定赛题后,赛题方会指定训练集和测试集两部分数据。参赛方需要在训练集上面构建模型,并在测试集上面验证模型的泛化能力。因此参赛者可以通过提交模型对测试集的预测结果,来验证自己模型的泛化能力。同时参赛方也会限制一些提交的次数限制,以此避免参赛选手“刷分”。

在一般情况下,参赛选手也可以自己在本地划分出一个验证集出来,进行本地验证。训练集,验证集和测试集分别有不同的作用:

  1. 训练集(Train Set):模型用于训练和调整参数
  2. 验证集(validation Set):用来验证模型精度和调整模型超参数
  3. 测试集(Test Set):验证模型的泛化能力

因为训练集和验证集是分开的,所以模型在验证集上面的精度在一定程度上可以反映模型的泛化能力。在划分验证集的时候,需要注意验证集的分布应该与测试集尽量保持一致,不然模型在验证集上的精度就失去了意义。

既然验证集这么重要,那么如何划分本地验证集呢。在一些比赛中,赛题方会提供特定的验证集;如果赛题方没有指定验证集,那么参赛选手就需要从训练集中拆分一部分得到验证集。验证集的划分如下几种方式:

  1. 留出法
    直接将训练计划分成两部分,新的训练集和验证集。这种划分最为简单;缺点是只得到了一份验证集,有可能导致模型在验证集上过拟合。留出法应用场景是数据量比较大的情况下。
  2. 交叉验证发
    将训练计划分成 K 份,将其中 K-1 份作为训练集,剩余的 1 分 作为验证集,循环 k
    训练。这猴子那个划分方式是左右训练集都是验证集,最终模型验证精度是 K 份平均得到。这种方式的优点是验证集精度比较可靠,训练 K 次可以得到 K 个有多样性差异的模型;cv 验证的缺点是需要训练 k 次,不适合数据量较大的情况
  3. 自主采样法
    通过有放回的采样方式得到新的训练集和验证集,每次的训练集和验证集都是有区别的。这种划分方式一般适用于数据量较小的情况。

在本次赛题中已经划分为验证集,因此选手可以直接使用训练集进行训练,并使用验证集进行验证精度(当然你也可以合并验证集和训练集,自行划分验证集)
当然这些划分方法是从数据划分方式角度来讲的,在现有的数据比赛中一般采用的划分方法是留出法和交叉验证法。如果数据量较大,留出法比较合适。防染任何的验证集的划分得到的验证集都是要保证训练集-验证集-测试集分布一致,所以不管以何种的方式划分都是需要注意。
这里的分布一般就是指与标签相关的统计分布,比如在分类任务重“分布”指的是标签的类别分布,训练集-验证集-测试集的类别分布情况应该大体一致;如果标签是带有时序信息,则验证集和测试集的时间间隔应该保持一致

天池赛事的零基础入门语义分割-地表建筑物识别任务是一个面向初学者的语义分割竞赛。任务的目标是利用机器学习和计算机视觉技术,对卫星图像中的地表建筑物进行标记和识别。 在这个任务中,参赛者需要使用给定的训练数据集进行模型训练和优化。训练数据集包含了一系列卫星图像和相应的像素级标注,标注了地表建筑物的位置。参赛者需要通过分析训练数据集中的图像和标注信息,来构建一个能够准确地识别出地表建筑物的模型。 参赛者需要注意的是,语义分割是指将图像中的每个像素进行分类,使得同一类别的像素具有相同的标签。因此,在地表建筑物识别任务中,参赛者需要将地表建筑物区域与其他区域进行区分,并正确地进行标记。这对于初学者来说可能是一个挑战,因此需要掌握基本的图像处理和机器学习知识。 参赛者可以根据自己的理解,选择合适的算法和模型来完成这个任务。常见的方法包括卷积神经网络(CNN),通过设计适当的网络结构和训练方式,提高模型的准确性和泛化能力。同时,数据预处理和数据增强技术也是提高模型性能的关键。参赛者可以通过对数据进行增强和扩充,提高模型的鲁棒性和识别能力。 最后,参赛者需要使用训练好的模型对测试数据集进行预测,并生成预测结果。这些预测结果将用于评估参赛者模型的性能和准确度。评估指标通常包括像素级准确度(Pixel Accuracy)和平均交并比(Mean Intersection over Union),参赛者需要根据这些指标来评估和改进自己的模型。 总之,通过参加这个任务,初学者可以通过实践和挑战来提高自己的图像处理和机器学习技能,并掌握语义分割的基本概念和方法。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值