文档角度检测

最新推荐文章于 2023-08-28 21:13:37 发布

watersink

最新推荐文章于 2023-08-28 21:13:37 发布

阅读量954

点赞数 2

分类专栏： OCR

本文链接：https://blog.csdn.net/qq_14845119/article/details/86626621

版权

OCR 专栏收录该内容

28 篇文章 9 订阅

订阅专栏

论文：Image Orientation Estimation with Convolutional Networks

传统Hough transform ：

import numpy as np
import cv2
import math
from scipy import ndimage

img_before = cv2.imread('./6ae1.jpg')

cv2.imshow("Before", img_before)    
key = cv2.waitKey(0)

img_gray = cv2.cvtColor(img_before, cv2.COLOR_BGR2GRAY)
img_edges = cv2.Canny(img_gray, 100, 100, apertureSize=3)
lines = cv2.HoughLinesP(img_edges, 1, math.pi / 180.0, 100, minLineLength=100, maxLineGap=5)

angles = []

for x1, y1, x2, y2 in lines[0]:
    cv2.line(img_before, (x1, y1), (x2, y2), (255, 0, 0), 3)
    angle = math.degrees(math.atan2(y2 - y1, x2 - x1))
    angles.append(angle)

median_angle = np.median(angles)
img_rotated = ndimage.rotate(img_before, median_angle)

print ("Angle is {}".format(median_angle))
cv2.imwrite('rotated.jpg', img_rotated)

论文方法：

传统的使用横线和竖线的检测会引入如上图所示的错误情况。

论文使用的训练数据集为Microsoft COCO ，数据增强操作包括，随机变换，对比度变化，高斯噪声。

测试集中去掉一些没有明确方向标注的数据，如下图所示，

论文网络结构使用AlexNet，训练的角度包括±30◦, ±45◦,全部 360◦ ，4角度（0, 90, 180, 270 ）这样4种角度分类的模型。

实验结果：

watersink

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
3
评论
文档角度检测

论文：Image Orientation Estimation with Convolutional Networks 传统Hough transform ：import numpy as npimport cv2import mathfrom scipy import ndimageimg_before = cv2.imread('./6ae1.jpg')cv2...
复制链接

扫一扫

专栏目录