项目要求
提供一张答题卡图像,通过图像处理识别出答题卡上每个题的选项,与正确答案对比,得出分数并写在答题卡上。
主要步骤:先进行仿射变换去除背景(只留试卷部分),二值化,圆形轮廓检测,遍历每一行选项,统计非零像素,记录填充选项(即非零像素最多的轮廓区域),与正确答案进行比对,正确则correct数+1,得到总成绩
1、预处理
1、灰度图
2、滤波去噪
3、边缘检测Canny
4、轮廓检测
# 预处理
image = cv2.imread("./images/test_01.png")
contours_img = image.copy()
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (5, 5), 0)#高斯滤波
cv_show('blurred',blurred)
edged = cv2.Canny(blurred, 75, 200)#边缘检测
cv_show('edged',edged)
# 轮廓检测:cnt保存的就是轮廓的坐标
cnts = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)[0]
cv2.drawContours(contours_img,cnts,-1,(0,0,255),3)
cv_show('contours_img',contours_img)
灰度图
边缘检测
轮廓检测
2、透视变换
透视变换的原理参考OCR文本扫描 轮廓检测 透视变换-唐宇迪笔记
# 确保检测到了
if len(cnts) > 0:
# 根据轮廓面积大小进行排序
cnts = sorted(cnts, key=cv2.contourArea, reverse=True)
# 遍历每一个轮廓
for c in cnts:
# 近似
peri = cv2.arcLength(c, True)
approx = cv2.approxPolyDP(c, 0.02 * peri, True)
# 准备做透视变换:如果顶点有4个,那么就是这个轮廓
if len(approx) == 4:#通过四个点来做变换
docCnt = approx
break
# 执行透视变换
warped = four_point_transform(gray, docCnt.reshape(4, 2))
cv_show('warped',warped)
def order_points(pts):
'''# 一共4个坐标点,其实这个函数就是将四个点按照左上,右上,右下,左下的位置排列'''
rect = np.zeros((4, 2), dtype = "float32")
# 按顺序找到对应坐标0123分别是 左上,右上,右下,左下
# 计算左上,右下
s = pts.sum(axis = 1)#所谓的pts.sum(axis=1)就是将pts这个4 * 2的矩阵的每行相加,得到四个值
rect[0] = pts[np.argmin(s)]#给出水平方向最小值的下标,rect[0]实际上就是pts的第一个点=(131,206)
rect[2] = pts[np.argmax(s)]#给出水平方向最大值的下标rect[2]=(448,614)
# 计算右上和左下
diff = np.diff(pts, axis = 1)#其实s和diff没有什么意义。就是为了下面的函数形使用
rect[1] = pts[np.argmin(diff)]
rect[3]