ctpn-数据预处理

最新推荐文章于 2021-09-07 15:11:29 发布

风车毛毽ing

最新推荐文章于 2021-09-07 15:11:29 发布

阅读量568

点赞数 1

分类专栏： CTPN整理文章标签： python

本文链接：https://blog.csdn.net/luckywalking/article/details/103340741

版权

CTPN整理专栏收录该内容

1 篇文章 0 订阅

订阅专栏

对原始图片尺寸无要求，原始图片按照比例resize成16的倍数。因ctpn采用锚点机制，且vgg16模型进行了4次pooling，输出的特征图的长宽都变为原图的1/16，因此将图片宽高处理为16的倍数
过滤掉无意义及宽度过小文本框；图片中对应文本框坐标，按照相同比例缩放，并确定四个点顺序为：以左上为原点，顺时针排列；

def orderConvex(p):
    points = Polygon(p).convex_hull
    points = np.array(points.exterior.coords)[:4]
    points = points[::-1]
    points = pickTopLeft(points)
    points = np.array(points).reshape([4, 2])
    return points

根据文本框坐标点，回归文本框上下两条直线，然后将文本框，以步长为16切分为小框；并按照小框的最大最小横纵坐标，返回每个小框的左上、右下坐标

def shrink_poly(poly, r=16):
    # y = kx + b
    x_min = int(np.min(poly[:, 0]))
    x_max = int(np.max(poly[:, 0]))

    k1 = (poly[1][1] - poly[0][1]) / (poly[1][0] - poly[0][0])
    b1 = poly[0][1] - k1 * poly[0][0]

    k2 = (poly[2][1] - poly[3][1]) / (poly[2][0] - poly[3][0])
    b2 = poly[3][1] - k2 * poly[3][0]

    res = []

    start = int((x_min // 16 + 1) * 16)
    end = int((x_max // 16) * 16)

    p = x_min
    res.append([p, int(k1 * p + b1),
                start - 1, int(k1 * (p + 15) + b1),
                start - 1, int(k2 * (p + 15) + b2),
                p, int(k2 * p + b2)])

    for p in range(start, end + 1, r):
        res.append([p, int(k1 * p + b1),
                    (p + 15), int(k1 * (p + 15) + b1),
                    (p + 15), int(k2 * (p + 15) + b2),
                    p, int(k2 * p + b2)])
    return np.array(res, dtype=np.int).reshape([-1, 8])

风车毛毽ing

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
ctpn-数据预处理

对原始图片尺寸无要求，原始图片按照比例resize成16的倍数。因ctpn采用锚点机制，且vgg16模型进行了4次pooling，输出的特征图的长宽都变为原图的1/16，因此将图片宽高处理为16的倍数过滤掉无意义及宽度过小文本框；图片中对应文本框坐标，按照相同比例缩放，并确定四个点顺序为：以左上为原点，顺时针排列；def orderConvex(p): points = Polyg...
复制链接

扫一扫