项目:答题卡识别
github地址
解决过程如下
预处理
先对图片进行Canny边缘检测,然后进行膨胀操作,膨胀操作的目的在于,如果纸张的外轮廓不是很明显,Canny边缘检测后纸张
外轮廓不连续有小洞,使用膨胀操作填充小洞
处理的结果如下:
轮廓检测
提取面积最大的轮廓MaxContour
,并进行自适应轮廓近似,自适应轮廓近似中取epsilon = 0.0001 * 周长
具体代码如下:
#步长设置为周长的0.0001倍,一般来说取epsilon = 0.001倍周长
step = 0.0001 * cv2.arcLength(cnts[0], True)
epsilon = step
#不断递增epsilon直到近似所得轮廓正好包含四个点
while len(cnt) != 4:
cnt = cv2.approxPolyDP(cnts[0], epsilon, True)
#步增epsilon
epsilon += step
处理结果如下:
透视变换
透视变换前需要先进性预处理,把轮廓的四个点按照左上、右上、右下、左下
的顺序进行排序,排序部分代码如下:
#将四个轮廓点排序
pts = np.zeros((4, 2), np.float32)
res = np.sum(points, axis=1)
pts[0] = points[np.argmin(res)]
pts[2] = points[np.argmax(res)]
res = np.diff(points, axis=1)
pts[1] = points[np.argmin(res)]
pts[3] = points[np.argmax(res)]
然后找到最大宽和最大高,具体代码如下:
#计算边长
w1 = np.sqrt((pts[0][0] - pts[1][0]) ** 2 + (pts[0][1] - pts[1][1]) ** 2)
w2