零基础入门CV之街道字符识别(一)

我感觉比较费时间的是pytorch的安装,由于在网上找不到一个合适的教程,安装pytorch花了很长时间,主要是网上的教程大多和我的情况不一样。

赛题理解

在这之前还没有接触过cv这一方向。所以第一眼看到赛题是一种很茫然的感觉。之后看了讲解学到了一个大概的思路。不过数据处理部分也是很重要的。

这次的cv比赛是对SVHN街道字符的识别。并且给了数据的字符位置框。

数据标签

数据标签中有字符的长,宽,字符的编码和左上角坐标x和左上角的坐标y。

然后就可以通过给出的数据标签信息进行标签的识别。

评测指标

这次的评测指标是整体识别率,就是编码正确的数量和整体编码值得比值。

读取数据

json格式标签数据的读取方式。这里是用到了一个python处理json的包。
下面给出代码

import json
# train_json字典格式
train_json = json.load(open('../input/train.json'))

# 数据标注处理
def parse_json(d):
   arr = np.array([
       d['top'], d['height'], d['left'],  d['width'], d['label']
   ])
   arr = arr.astype(int)
   return arr

img = cv2.imread('../input/train/000000.png')
arr = parse_json(train_json['000000.png'])

plt.figure(figsize=(10, 10)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值