ICDAR文本检测的数据集label每一行代表一个文本框的四个点坐标,按时顺时针方向,依次为左上、右上、右下和左下,例如734,310,792,320,792,364,738,361,### 。###代表文字不清楚。
数据集介绍 https://blog.csdn.net/u013250416/article/details/78821877
官网不好下,这里给个ICDAR2015数据集的百度网盘链接:
https://pan.baidu.com/s/1lwbFMlstM0aIPSPYsyTQ6A
提取码:8egn
labelme自己标注的后置调用api生成的一般是json格式的,为了把他们放在一起训练,这里把json格式转成txt
# -*- coding: utf-8 -*-
import glob
import os.path
import numpy as np
import shutil
import json
INPUT_PATH = "E:/card_data/card_autolabel/20200116"
def jsonTotxt(jsonfile):
filename=os.path.split(jsonfile)[1].split('.')[0]
savefile = os.path.join("E:/datasets/icdar",filename+'.txt')
# read json
#setting = []
with open(jsonfile,

最低0.47元/天 解锁文章

2770

被折叠的 条评论
为什么被折叠?



