零基础入门CV之街道字符识别（一）

最新推荐文章于 2021-04-28 16:06:45 发布

misaka2019

最新推荐文章于 2021-04-28 16:06:45 发布

阅读量530

点赞数

文章标签： python 计算机视觉深度学习机器学习人工智能

本文链接：https://blog.csdn.net/Mikow/article/details/106234810

版权

我感觉比较费时间的是pytorch的安装，由于在网上找不到一个合适的教程，安装pytorch花了很长时间，主要是网上的教程大多和我的情况不一样。

赛题理解

在这之前还没有接触过cv这一方向。所以第一眼看到赛题是一种很茫然的感觉。之后看了讲解学到了一个大概的思路。不过数据处理部分也是很重要的。

这次的cv比赛是对SVHN街道字符的识别。并且给了数据的字符位置框。

数据标签

数据标签中有字符的长，宽，字符的编码和左上角坐标x和左上角的坐标y。

然后就可以通过给出的数据标签信息进行标签的识别。

评测指标

这次的评测指标是整体识别率，就是编码正确的数量和整体编码值得比值。

读取数据

json格式标签数据的读取方式。这里是用到了一个python处理json的包。
下面给出代码

import json
# train_json字典格式
train_json = json.load(open('../input/train.json'))

# 数据标注处理
def parse_json(d):
   arr = np.array([
       d['top'], d['height'], d['left'],  d['width'], d['label']
   ])
   arr = arr.astype(int)
   return arr

img = cv2.imread('../input/train/000000.png')
arr = parse_json(train_json['000000.png'])

plt.figure(figsize=(10, 10)