一、CTPN的tensorflow版本网址如下:
https://github.com/eragonruan/text-detection-ctpn
二、CTPN的tensorflow版本制作自己的数据集(即生成对应的gt_name.txt)
需要标注的格式为:x1,y1,x2,y2,x3,y3,x4,y4,language,content
upper left----(x1,y1)
upper right----(x2,y2)
low right-----(x3,y3)
low left-----(x4,y4)
为顺时针标注
三、将以上的gt_name.txt文件用split_label.py文件进行处理,即可生成训练所需要的标注为小竖条的数据
生成的标注框的小矩形的格式为x1,y1,x2,y2
upper left-------(x1,y1)
low right--------(x2,y2)
四、例子如下:
原图
五、split_label.py的代码如下
import os
import sys
import cv2 as cv
import numpy as np
from tqdm import tqdm
sys.path.