计算机视觉——图像检索

最新推荐文章于 2022-06-19 13:01:38 发布

ma0303

最新推荐文章于 2022-06-19 13:01:38 发布

阅读量625

点赞数

分类专栏： CV 文章标签：计算机视觉

本文链接：https://blog.csdn.net/ma0303/article/details/106242162

版权

本文介绍计算机视觉中的街道字符识别问题，详细阐述题目理解、数据标签、评测指标和解题思路，旨在帮助竞赛选手入门视觉赛题，提升数据建模能力。采用公开数据集SVHN，将字符识别转化为定长分类问题，简化任务并提供解决方案。

摘要由CSDN通过智能技术生成

题目理解

零基础入门CV之街道字符识别

通过这道题走入计算机视觉的世界，主要针对竞赛选手上手视觉赛题，提高对数据建模能力。

以计算机视觉中字符识别为背景，预测街道字符编码，题目数据采用公开数据集SVHN。

对于训练数据每张图片将给出对应的编码标签，和具体的字符框的位置，可用于模型训练：

字符坐标具体如下：

具体计算公式如下：
Score=编码识别正确的数量/测试集图片数量

JSON中标签的读取方式：

import json
train_json = json.load(open('../input/train.json'))

# 数据标注处理
def parse_json(d):
   arr = np.array([
       d['top'

关注