零基础入门CV赛事- 街景字符编码识别--Task1赛题理解

yyy_balabala小屋

于 2020-05-20 20:44:43 发布

阅读量331

点赞数

分类专栏： cv学习文章标签：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42713048/article/details/106241944

版权

cv学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

街景字符编码识别这是一个典型的字符识别问题。

数据来源

以街道字符为数据，训练集数据包括 3W 张照片，验证集数据包括 1W 张照片，每张照片包括颜色图像和对应的编码类别和具体位置；为了保证比赛的公平性，测试集 A 包括 4W 张照片，测试集 B 包括 4W 张照片。

数据标签

对于训练数据每张图片将给出对于的编码标签，和具体的字符框的位置（训练集，测试集和验证集都给出字符位置），可用于模型训练：

字符的具体坐标如下所示：

数据的读取

评价指标

实验以识别准确率为评价标准，任何一个字符错误均视为错误，准确率越大越好，具体计算公式如下：
score= 编码识别正确的数量/测试集图片数量

解题思路

本质为分类问题，对图片中的字符进行识别，由于不同的难度，图片中字符的长度也是各不相同的，最简单的情况为定长字符识别，将每张图片中字符长度设为所有图片中最大字符长度数，字符个数不够的，可以进行填充。以专业字符识别思路考虑不定长字符识别，比较典型的有CRNN字符识别模型。在本次赛题中给定的图像数据都比较规整，可以视为一个单词或者一个句子。再增大难度，从专业分类角度，需进行检测再识别，首先将字符的位置进行识别，利用物体检测的思路完成——需要构建字符检测模型，对测试集中的字符进行识别。可参考物体检测模型SSD或者YOLO来完成。

yyy_balabala小屋

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
零基础入门CV赛事- 街景字符编码识别--Task1赛题理解

街景字符编码识别这是一个典型的字符识别问题。数据来源以街道字符为数据，训练集数据包括 3W 张照片，验证集数据包括 1W 张照片，每张照片包括颜色图像和对应的编码类别和具体位置；为了保证比赛的公平性，测试集 A 包括 4W 张照片，测试集 B 包括 4W 张照片。数据标签对于训练数据每张图片将给出对于的编码标签，和具体的字符框的位置（训练集，测试集和验证集都给出字符位置），可用于模型训练：字符的具体坐标如下所示：数据的读取评价指标实验以识别
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。