Datawhale 零基础入门CV赛事Task1 赛题理解

Task1 赛题理解

1.赛题理解

赛题名称:零基础入门CV之街道字符识别
赛题任务:赛题以计算机视觉中字符识别为背景,要求选手预测街道字符编码,这是一个典型的字符识别问题。

2.赛题数据

赛题以街道字符为为赛题数据,来自收集的SVHN街道字符,并进行了匿名采样处理。
在这里插入图片描述
在这里插入图片描述
训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和具体位置;为了保证比赛的公平性,测试集A包括4W张照片,测试集B包括4W张照片。

3.数据标签

对于训练数据每张图片将给出对于的编码标签,和具体的字符框的位置(训练集、验证集都给出字符位置),可用于模型训练:
字符坐标如下在这里插入图片描述

4.评测指标

以编码整体识别准确率为评价指标。任何一个字符错误都为错误,最终评测指标结果越大越好,具体计算公式如下:
Score=编码识别正确的数量/测试集图片数量

5.解题思路

本质是图像分类问题,难点在于图片字符数不确定,最多6个。
思路1:将赛题抽象为定长(6位)字符识别。
思路2:用文本识别的方法解决不定长字符识别问题。
思路3:先检测后识别,属于目标检测领域。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值