Datawhale零基础入门CV赛事
qq_38689228
这个作者很懒,什么都没留下…
展开
-
Datawhale 零基础入门CV赛事-Task5 模型集成
1.模型集成 集成学习方法,深度学习中的集成学习,结果后处理。 机器学习:Stacking、Bagging和Boosting 2.深度学习 2.1.交叉验证,留出法 方法1:十折验证得到十个模型,分别用十个模型预测得到概率值进行平均作为结果,解码为具体字符 方法2:每一个模型输出一个分类结果(字符),对字符统计进行投票 2.2 dropout 训练过程中随机让一部分节点停止工作,预测过程中所有节点工作,这样可以降低模型复杂度,同时增加预测精度。 3.代码 加入Dropout后的网络结构如下: # 定义模原创 2020-06-02 22:37:04 · 101 阅读 · 0 评论 -
Datawhale 零基础入门CV赛事-Task4 模型训练与验证
模型的训练与验证 1.验证集动机 训练过程中,模型复杂度过高,泛化效果差,导致过拟合。 训练不足,模型复杂度过低,模型在训练集效果差,欠拟合。 随着模型复杂度和模型训练轮数增加,CNN模型在训练集误差会降低,但在测试集先降低再升高,训练过程中,希望模型能经受住测试集的考验。 比喻:训练是学习的过程,验证是小考,测试是高考。 需要注意:无论是训练集还是验证集都是有标签的,测试集是没有标签的。 2.有三种划分验证集方法 1.留一法2.交叉验证法3.自助采样法 3.模型的训练与验证 1.构造训练集和验证集 2.原创 2020-05-30 23:00:31 · 72 阅读 · 0 评论 -
Datawhale 零基础入门CV赛事-Task3 字符识别模型
1.字符识别模型 学习CNN原理,搭建CNN字符识别模型,完成训练。 2.CNN 构成:卷积,池化,非线性激活函数和全连接层构成。 工作过程:CNN经过多次卷积和池化正则化最后一层将图像像素映射为具体的输出。在分类任务中会转换成不同类别概率的输出,然后计算预测值与标签的差异,反向传播误差更新每一层参数,更新完成后前向计算预测值,如此反复直至训练完成。 特点:端到端,不需要人工提取特征。 3.结构 R,S,T分别表示非线性激活函数 4.pytorch构建CNN模型(代码) 过程:1.读取数据2.构建cnn原创 2020-05-24 11:31:20 · 104 阅读 · 0 评论 -
Datawhale零基础⼊⻔CV-Task2 数据读取与数据扩增
1.任务描述 数据读取,数据扩增,pytorch读取数据 2.图像读取 赛题数据:图像 赛题任务:识别图像字符 数据读取工具:pillow,opencv等python库 2.1pillow 2.2opencv opencv是一个跨平台视觉库,功能强大。 3.数据扩增 数据扩增(Data Augmentation) 用途:增加训练集样本,缓解过拟合,增强泛化。 方法: ...原创 2020-05-23 18:59:13 · 184 阅读 · 0 评论 -
Datawhale 零基础入门CV赛事Task1 赛题理解
Task1 赛题理解 1.赛题理解 赛题名称:零基础入门CV之街道字符识别 赛题任务:赛题以计算机视觉中字符识别为背景,要求选手预测街道字符编码,这是一个典型的字符识别问题。 2.赛题数据 赛题以街道字符为为赛题数据,来自收集的SVHN街道字符,并进行了匿名采样处理。 在这里插入图片描述 在这里插入图片描述 训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和具体位置;为了保证比赛的公平性,测试集A包括4W张照片,测试集B包括4W张照片。 3.数据标签 对于训练数据每张原创 2020-05-20 16:11:20 · 157 阅读 · 0 评论