零基础入门CV赛事- 街景字符编码识别--Task1赛题理解

街景字符编码识别这是一个典型的字符识别问题。
  • 数据来源

以街道字符为数据,训练集数据包括 3W 张照片,验证集数据包括 1W 张照片,每张照片包括颜色图像和对应的编码类别和具体位置;为了保证比赛的公平性,测试集 A 包括 4W 张照片,测试集 B 包括 4W 张照片。
  • 数据标签

对于训练数据每张图片将给出对于的编码标签,和具体的字符框的位置(训练集,测试集和验证集都给出字符位置),可用于模型训练:

字符的具体坐标如下所示:

  • 数据的读取

  • 评价指标

实验以识别准确率为评价标准,任何一个字符错误均视为错误,准确率越大越好,具体计算公式如下:
                                                          score= 编码识别正确的数量/测试集图片数量

  • 解题思路

本质为分类问题,对图片中的字符进行识别,由于不同的难度,图片中字符的长度也是各不相同的,最简单的情况为定长字符识别,将每张图片中字符长度设为所有图片中最大字符长度数,字符个数不够的,可以进行填充。以专业字符识别思路考虑不定长字符识别,比较典型的有CRNN字符识别模型。在本次赛题中给定的图像数据都比较规整,可以视为一个单词或者一个句子。再增大难度,从专业分类角度,需进行检测再识别,首先将字符的位置进行识别,利用物体检测的思路完成——需要构建字符检测模型,对测试集中的字符进行识别。可参考物体检测模型SSD或者YOLO来完成。


​ 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值