最近需要对TotalText数据集进行一个处理,主要分为两部:
1、首先利用opencv将txt里标记的区域批量裁剪并保存下来。
2、然后利用TPS算法对裁剪后的图片进行“拉直”变换,并将输出格式定为200*64。效果展示:
裁剪后的原图
tps处理后“拉直”的图片
注意:
标记点为偶数个,故间隔为(点数/2 - 1)
import cv2
import numpy as np
# from PIL import Image
import os
def tps_for_total(num):
# gt_path = '/home/this/桌面/img8/poly_gt_img.txt'
# img_path = '/home/this/桌面/img8/img194.jpg&