Ocr基础技术,图像矫正,主要是通过检测图片的四个斜切角的坐标,然后进行仿射变换为标准图,这里主要是检测四个点,矫正的话就通过透视变换就可以了,透视变换我这里不多讲。
效果图:
上代码
import cv2
import numpy as np
def start(imagePath):
img = cv2.imread(imagePath)
cv2.imshow("src", img)
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
imageHeight, imageWidth = grayImage.shape[0:2]
print(imageWidth,", ", imageHeight)
# 进行一次自适应阈值提升边界识别度,参数可根据不同图片适当调整,特别是左后一个参数
binaryImage = cv2.adaptiveThreshold(grayImage, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 35, 10)
cv2.imshow("binaryImage", ~binaryI