我感觉比较费时间的是pytorch的安装,由于在网上找不到一个合适的教程,安装pytorch花了很长时间,主要是网上的教程大多和我的情况不一样。
赛题理解
在这之前还没有接触过cv这一方向。所以第一眼看到赛题是一种很茫然的感觉。之后看了讲解学到了一个大概的思路。不过数据处理部分也是很重要的。
这次的cv比赛是对SVHN街道字符的识别。并且给了数据的字符位置框。
数据标签
数据标签中有字符的长,宽,字符的编码和左上角坐标x和左上角的坐标y。
然后就可以通过给出的数据标签信息进行标签的识别。
评测指标
这次的评测指标是整体识别率,就是编码正确的数量和整体编码值得比值。
读取数据
json格式标签数据的读取方式。这里是用到了一个python处理json的包。
下面给出代码
import json
# train_json字典格式
train_json = json.load(open('../input/train.json'))
# 数据标注处理
def parse_json(d):
arr = np.array([
d['top'], d['height'], d['left'], d['width'], d['label']
])
arr = arr.astype(int)
return arr
img = cv2.imread('../input/train/000000.png')
arr = parse_json(train_json['000000.png'])
plt.figure(figsize=(10, 10)