python 图像矫正_OCR 图像矫正

最新推荐文章于 2024-06-11 10:03:52 发布

weixin_39723010

最新推荐文章于 2024-06-11 10:03:52 发布

阅读量668

点赞数

文章标签： python 图像矫正

OCR(Optical Character Recognition，光学字符识别)是指电子设备检查纸上字符然后用字符识别方法将形状翻译成计算机文字的过程；采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。

一般来说，OCR分为分割和识别两个部分。此文将探讨分割问题。

通常我们第一步是将用户传入的照片进行扫描，提取待识别的区域，也就如图下面将文件抠出来。

具体步骤：

(1)获取文件轮廓

(2)获取文件四角的点坐标

(3)透视变换

导入库

import numpy as np

import cv2

import matplotlib.pyplot as plt

import math

获取文件轮廓

image = cv2.imread('原始照片.jpg') #读原始照片

gray = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY) #二值化

gray = cv2.GaussianBlur(gray, (5, 5), 0) #高斯滤波

kernel = np.ones((3,3),np.uint8)

dilation = cv2.dilate(gray,kernel) #膨胀

edged = cv2.Canny(dilation, 30, 120) #边缘提取

_, cnts, hierarchy = cv2.findContours(edged,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_NONE)

cv2.drawContours(image,cnts,-1,(0,0,255),3)

获取文件四角点的坐标

cnts0=cnts[0]

cnts1=cnts[1]

rect = np.zeros((4,2), dtype="float32")

rect[0] = cnts1[np.argmin(np.sum(cnts1,axis=-1))]

rect[2] = cnts0[np.argmax(np.sum(cnts0,axis=-1))]

rect[1] = cnts1[np.argmin(np.diff(cnts1,axis=-1))]

rect[3] = cnts0[np.argmax(np.diff(cnts0,axis=-1))]

四角点的顺序：左上，右上，右下，左下

左上坐标和最小，右下坐标和最大

右上坐标差最小，左下坐标差最大(Y-X)

根据四角点坐标求矫正后图像的尺寸

(tl,tr,br,bl) = rect

width1 = np.sqrt(((tr[0]-tl[0])**2)+((tr[1]-tl[1])**2))

width2 = np.sqrt(((br[0]-bl[0])**2)+((br[1]-bl[1])**2))

width = max(int(width1),int(width2))

height1 = np.sqrt(((tr[0]-br[0])**2)+((tr[1]-br[1])**2))

height2 = np.sqrt(((tl[0]-bl[0])**2)+((tl[1]-bl[1])**2))

height = max(int(height1),int(height2))

dst = np.array([

[0, 0],

[width - 1, 0],

[width - 1, height - 1],

[0, height - 1]], dtype = "float32")

透视变换

M = cv2.getPerspectiveTransform(rect, dst)

warped = cv2.warpPerspective(image, M, (width, height))

weixin_39723010

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。