街景字符编码识别项目学习笔记（一）赛题理解

最新推荐文章于 2020-06-02 18:47:15 发布

幻灵H_Ling

最新推荐文章于 2020-06-02 18:47:15 发布

阅读量454

点赞数 1

分类专栏：街景字符编码识别项目学习笔记文章标签：深度学习 python 人工智能图像识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42716570/article/details/106221565

版权

项目介绍

此次项目为datawhale和阿里天池合作举办的cv入门赛事街道字符识别。该任务较早见于花书的作者古德费洛在12-13年在谷歌做出的研究。当时谷歌需要对极大的街景门牌号图片数据集进行数字提取以使每一个地点能在谷歌地图上有正确的门牌号信息。这样一个转码项目必然要消耗极大的人力物力，因此当时采用深度学习模型来实现自动转码，并最终取得了98%的覆盖率，大幅提高效率。

数据说明

本次项目采用谷歌公开数据集SVHM，其中测试集数据为3万张图片，验证集数据为1万张图片。
SVHM中的原始图片
为了降低比赛的难度，对于每一张图片，都有对应的编码标签和具体的字符框的位置以用于模型的训练，具体的数据格式说明如下表所示：

Field	Description
top	字符框左上角的坐标X
height	字符高度
left	字符框左上角的坐标Y
width	字符框的宽度
label	字符编码

图示如下：
数据集图片编码对应的图示
因为一张图片可能包含一个或多个字符，因此在比赛数据集当中的JSON标注中，会有两个边框信息。示例图片的JSON标注如下图所示：数据集图片的JSON标注格式

评价指标

项目的评测指标以字符串整体的识别率作为标准，其中任何一个字符的错误都算整体错误。score表示如下：

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
街景字符编码识别项目学习笔记（一）赛题理解

datawhalecv项目系列学习博客（一）赛题理解
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。