OCR识别之图像预处理

图像预处理之作用及效果

无论是使用图像来做识别还是别的操作,都需要对图像做一定的预处理操作,预处理的作用是方便后续我们对图像的识别,分类等操作。对于OCR识别来说要达到的效果如下图:
原始输入图像:
在这里插入图片描述
预处理之后的图像:
在这里插入图片描述

图像预处理之操作

以本实例的图像来说,首先需要找到内部白色纸片的边界,通过边界找到它的轮廓信息。根据其轮廓信息,应用Opencv中的轮廓近似得到大致的矩形区域,然后通过计算得到该矩形区域的宽高和四个顶点的坐标。然后将该矩形区域,直接通过变换转成(宽,高)的图像。

图像预处理之源代码

img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
img_gauss_blur = cv2.GaussianBlur(img_gray,(5,5),0)
img_canny = cv2.Canny(img_gray,34,158)
#以上代码,查找边界

#根据查找到的边界信息,找到其轮廓信息
contours,h = cv2.findContours(img_canny,cv2.RETR_TREE,cv2.CHAIN_APPROX_NONE)

#根据具体的实例,在众多轮廓中找到周长最大的前几个
length = []
for i,contour in enumerate(contours):
    length.append(cv2.arcLength(contour,True))
index = np.argmax(length)


#对找到的周长最大的几个轮廓进行排序
def s(con):
    return cv2.arcLength(con,True)
cnts = sorted(contours,key = s,reverse=True)[:1]

#找到轮廓近似
long = cv2.arcLength(cnts[0],True)
approx = cv2.approxPolyDP(cnts[0],0.1*long,True)

res = cv2.drawContours(img.copy(),[approx],-1,(0,0,255),2)

#通过近似轮廓找到四个顶点
tr = approx[0][0]
br = approx[1][0]
bl = approx[2][0]
tl = approx[3][0]

#通过四个顶点计算相应的宽度和高度
widthr = int(np.sqrt((br[0]-tr[0])**2+(br[1]-tr[1])**2))
widthl = int(np.sqrt((bl[0]-tl[0])**2+(bl[1]-tl[1])**2))
width = np.max((widthr,widthl))

heightb = int(np.sqrt((br[0]-bl[0])**2+(br[1]-bl[1])**2))
heightt = int(np.sqrt((tr[0]-tl[0])**2+(tr[1]-tl[1])**2))
height = np.max((heightb,heightt))

#原始的矩形点,变换后的点
old_point = np.array([tl.tolist(),tr.tolist(),br.tolist(),bl.tolist()],np.float32)
new_point = np.array([[0,height-1],[0,0],[width-1,0],[width-1,height-1]],np.float32)

#得到转换矩阵
M = cv2.getPerspectiveTransform(old_point,new_point)

#得到转换后的图像
new_image = cv2.warpPerspective(img,M,(width-1,height-1))
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值