零基础入门CV赛事- 街景字符编码识别
零基础入门CV赛事- 街景字符编码识别
csdnshenjiaye
这个作者很懒,什么都没留下…
展开
-
Task5:模型集成
5.1 学习目标 学习集成学习方法以及交叉验证情况下的模型集成 学会使用深度学习模型的集成学习 5.2 集成学习方法 在机器学习中的集成学习可以在一定程度上提高预测精度,常见的集成学习方法有Stacking、Bagging和Boosting,同时这些集成学习方法与具体验证集划分联系紧密。 由于深度学习模型一般需要较长的训练周期,如果硬件设备不允许建议选取留出法,如果需要追求精度可以使用交叉验证的方法。 下面假设构建了10折交叉验证,训练得到10个CNN模型。 那么在10个CNN模型原创 2020-06-02 21:36:27 · 148 阅读 · 0 评论 -
Task4:模型训练与验证
4.2 构造验证集 在机器学习模型(特别是深度学习模型)的训练过程中,模型是非常容易过拟合的。深度学习模型在不断的训练过程中训练误差会逐渐降低,但测试误差的走势则不一定。 在模型的训练过程中,模型只能利用训练数据来进行训练,模型并不能接触到测试集上的样本。因此模型如果将训练集学的过好,模型就会记住训练样本的细节,导致模型在测试集的泛化效果较差,这种现象称为过拟合(Overfitting)。与过拟合相对应的是欠拟合(Underfitting),即模型在训练集上的拟合效果较差。 随着模型复杂度和模型训练原创 2020-05-30 19:37:25 · 731 阅读 · 0 评论 -
Task3:字符识别模型
3.1 学习目标 学习CNN基础和原理 使用Pytorch框架构建CNN模型,并完成训练 3.2 CNN介绍 卷积神经网络(简称CNN)是一类特殊的人工神经网络,是深度学习中重要的一个分支。CNN在很多领域都表现优异,精度和速度比传统计算学习算法高很多。特别是在计算机视觉领域,CNN是解决图像分类、图像检索、物体检测和语义分割的主流模型。 CNN每一层由众多的卷积核组成,每个卷积核对输入的像素进行卷积操作,得到下一次的输入。随着网络层的增加卷积核会逐渐扩大感受野,并缩减图像的尺寸。原创 2020-05-25 23:10:25 · 319 阅读 · 0 评论 -
Task2:数据读取与数据扩增
1.Pytorch读取数据 由于本次赛题我们使用Pytorch框架讲解具体的解决方案,接下来将是解决赛题的第一步使用Pytorch读取赛题数据。 在Pytorch中数据是通过Dataset进行封装,并通过DataLoder进行并行读取。所以我们只需要重载一下数据读取的逻辑就可以完成数据的读取。 import os, sys, glob, shutil, json import cv2 from PIL import Image import numpy as np import torch fro原创 2020-05-23 10:59:10 · 286 阅读 · 0 评论 -
Task1:赛题理解
赛题简介 本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第二场 —— 零基础入门CV之街景字符识别比赛。 赛题以计算机视觉中字符识别为背景,要求选手预测真实场景下的字符识别,这是一个典型的字符识别问题。通过这道赛题可以引导大家走入计算机视觉的世界,主要针对竞赛选手上手视觉赛题,提高对数据建模能力。 更好的引导大家入门,我们同时为本赛题定制了系列学习方案,其中包括数据科学库、通用流程和baseline方案学习三部分。通过对本方案的完整学习,可以帮助掌握数据竞赛基本技能。同时我们也将提供专属原创 2020-05-20 16:36:10 · 226 阅读 · 0 评论