【datawhale】学习小组打卡博客1

【datawhale】学习小组打卡

比赛链接:零基础入门 CV 赛事 - 街景字符编码识别
打卡任务:赛题理解

赛题数据

赛题来源自 Google 街景图像中的门牌号数据集(The Street View House Numbers Dataset, SVHN),并根据一定方式采样得到比赛数据集。
数据集报名后可见并可下载,该数据来自真实场景的门牌号。训练集数据包括 3W 张照片,验证集数据包括 1W 张照片,每张照片包括颜色图像和对应的编码类别和具体位置;为了保证比赛的公平性,测试集 A 包括 4W 张照片,测试集 B 包括 4W 张照片。

评价指标

评价标准为准确率,选手提交结果与实际图片的编码进行对比,以编码整体识别准确率为评价指标,结果越大越好,具体计算公式如下:
s c o r e = 编 码 识 别 正 确 的 数 量 测 试 集 图 片 数 量 score = \frac {编码识别正确的数量} {测试集图片数量} score=

数据标签

通过解析json文件发现,数据集标签包含:height、label、left、top、width。
在这里插入图片描述
其表示的含义为

FieldDescription
height字符高度
label字符编码
left左上角最表Y
top左上角坐标X
width字符宽度
解题思路
  1. 这是一个多标签字符分类问题。可以直接用multi label来进行训练;也可以看做目标检测问题,先把每个字符位置检测出来,再进行分类,这样分类会很容易。
  2. 需要分类的目标是字符,边缘轮廓比较清晰,可以利用传统CV算法进行辅助,边缘检测、腐蚀膨胀、二值化等操作。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值