datawhale零基础入门cv教程(1)——task1.赛题理解

本文介绍了零基础入门CV赛事的赛题任务,涉及街景字符编码识别,使用SVHN数据集。重点理解了数据标签、评测指标,并提供了从JSON到ndarry的转换方法。总结了三种识别策略:定长字符识别、不定长字符识别和检测再识别。
摘要由CSDN通过智能技术生成

赛题任务

赛题链接:零基础入门CV赛事- 街景字符编码识别
以字符识别为背景,预测街道字符编码。
赛题选择数据集SVHN。

task1学习目标

理解赛题数据

首先赛题指出了只能用比赛给定的数据集进行训练,而不能使用SVHN原始数据集进行训练
训练集(train)有3w张照片,验证集(validation)有1w张照片。
每张照片包括颜色图像对应的编码类别(数字)具体位置
颜色图像放在mchar_train.zip中.(图片)
对应的编码类别和具体位置放在mchar_train.json中**(标签)**

理解数据标签

查看mchar_train.json并对其中的参数进行理解.
图片0:
在这里插入图片描述
标签0:
在这里插入图片描述
首先是对标签中的参数进行理解:top,left,height,width告诉了我们字符所在长方形的位置信息,label告诉了我们字符是哪个数字.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值