基于OpenCV及Python的数独问题识别与求解(一)图像预处理

本人平时比较喜欢玩数独,但比较难的数独经常一做就是半个多小时。这学期选了一门”计算机视觉”课,课程最后要做一个项目,正好我就想能不能写一个程序,用手机拍个照或者截个图,放进程序里跑一下,自动就把题目识别然后解出来了,and it was so.

先来看一个opencv里自带的数独图片:

sudoku

程序的最终目的就是将这种图像转化为一个矩阵或者说二维数组,来要告诉计算机在9x9的方格中哪个位置有数字、数字是什么,就像下面的形式:

[[0 0 0 6 0 4 7 0 0]
 [7 0 6 0 0 0 0 0 9]
 [0 0 0 0 0 5 0 8 0]
 [0 7 0 0 2 0 0 9 3]
 [8 0 0 0 0 0 0 0 5]
 [4 3 0 0 1 0 0 7 0]
 [0 5 0 2 0 0 0 0 0]
 [3 0 0 0 0 0 2 0 8]
 [0 0 2 3 0 1 0 0 0]]

在这个二维数组里,用0表示要填写的数字,用1-9表示识别出来的题目数字。

了解主要任务之后,下面就是具体的步骤了:

  1. 图像预处理
  2. 识别边框
  3. 图像校正
  4. 提取数字
  5. 识别数字
  6. 计算答案

这里使用的语言及版本如下,关于开发环境的配置可以参考本人另一篇文章

  • Python 版本:3.6.3 (Anaconda 3)
  • OpenCV 版本:3.3.1

第一篇文章主要讲解图像预处理部分,并给出使用 matplotlib 显示 OpenCV 图像的方法。


图像预处理

首先是使用 cv2.imread() 函数读取原图片,然后使用 cv2.cvtColor() 灰度化,因为颜色信息不重要。之后是使用滤波算法进行降噪处理,因为滤波处理对于识别效果有很大影响。常用的有均值滤波、高斯滤波、中值滤波、双边滤波等,具体使用方法可以参考这里。本文使用高斯滤波及中值滤波,但是滤波参数不能适用于所有情况的图像, 必须根据图像尺寸和清晰度做调整

img_original = cv2.imread('./images/p1.png')
img_gray = cv2.cvtColor(img_original, cv2.COLOR_BGR2GRAY)
img_Blur = cv2.medianBlur(img_gray, 3)
img_Blur = cv2.GaussianBlur(img_Blur, (3, 3), 0)

可以看到,Python 版本的 OpenCV 与 C++ 版本有个很大的区别,就是处理后的图像一般作为函数的返回值(之一),而C++需要将原图像和处理后图像的地址作为参数传入,这是 Python 中函数可以返回多个值的特点决定的。

此图片在预处理阶段要解决的主要问题是亮度不均衡,图像左下角比较暗,如果直接进行二值化效果较差,对滤波后图像取100作为阈值处理得到中间的图像,左下部分图像缺失;若进行自适应阈值操作,可以得到较好的效果,但左下部分线条亦有缺失:

二值化

参考 stackflow 上一位大神的方法,以圆形作为结构化元素进行闭操作,将灰度图像除以闭操作后图像,再进行归一化。

kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (11, 11))
close = cv2.morphologyEx(img_Blur, cv2.MORPH_CLOSE, kernel)
div = np.float32(img_Blur) / close
img_brightness_adjust = np.uint8(cv2.normalize(div, div, 0, 255, cv2.NORM_MINMAX))

第一句使用cv2.getStructuringElement() 获取结构元素,可以使用椭圆、矩形、十字形三种,这里使用椭圆。第二句使用cv2.morphologyEx() 对原图使用刚才的结构元素进行闭操作。将灰度图像除以闭操作后图像,但要先转换成 float32 类型才能除,/ 运算符相当于调用numpy中的divide函数,即点除,又即每个像素点分别相除,且只保留整数部分。最后将除的结果归一化到 [0, 255] 区间内,并转换回 无符号8位整数(uint8) 类型。

结果如下图,效果拔群:

亮度调整

下一步是二值化,OpenCV中二值化有简单阈值、自适应阈值、Otsu’s二值化等方法,可以参考这里。简单阈值是一种全局性的阈值,整个图像都和这个阈值比较。而自适应阈值可以看成一种局部性的阈值,通过规定一个区域大小,比较这个点与区域大小里面像素点的平均值(或者其他特征)的大小关系确定这个像素点是属于黑或者白。这里使用自适应阈值方法,代码如下:

img_thresh = cv2.adaptiveThreshold(img_brightness_adjust, 255,
                                   cv2.ADAPTIVE_THRESH_GAUSSIAN_C,
                                   cv2.THRESH_BINARY_INV, 11, 7)

使用 cv2.adaptiveThreshold() 函数, 其中 cv2.ADAPTIVE_THRESH_GAUSSIAN_C 代表在小区域内阈值选取为加权和,以高斯分布确定权重。cv2.THRESH_BINARY_INV 代表二值化的结果取反,为下一步形态学处理做准备。

这里写图片描述


使用 matplotlib 显示 OpenCV 图像

Matplotlib是Python中最常用的可视化工具之一,可以非常方便地创建海量类型地2D图表和一些基本的3D图表。也可以方便地显示图像。

众所周知,OpenCV 中彩色图像的像素是以 Bule Green Red 为顺序的,也就是BGR,而普通的图像则是采用RGB顺序,因此要在其他地方(如Qt、matplotlib 中)使用 OpenCV 的彩色图像,就必须转换格式。

我将使用 matplotlib 显示 OpenCV 图像的功能写成了一个函数:

def plotImg(img, title=""):
    if img.ndim == 3:
        b, g, r = cv2.split(img)
        img = cv2.merge([r, g, b])
        plt.imshow(img), plt.axis("off")
    else:
        plt.imshow(img, cmap='gray'), plt.axis("off")
    plt.title(title)
    plt.show()

这里先判断输入图像是不是3维,即彩色图,是的话进行转换,不是的话作为灰度图显示。转换代码中分割再重新组合的方法,还可以使用 img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) 。注意如果灰度图不加 cmap='gray' 这个参数,会显示为“热度图”。

当然不要忘了开头加上:

import cv2
from matplotlib import pyplot as plt

matplotlib 还可以像 MATLAB 里一样方便的显示多个图像,例如这里并列显示两幅图像:

def plotImgs(img1, img2):
    if img1.ndim == 3:
        b, g, r = cv2.split(img1)
        img1 = cv2.merge([r, g, b])
        plt.subplot(121), plt.imshow(img1), plt.axis("off")
    else:
        plt.subplot(121), plt.imshow(img1, cmap='gray'), plt.axis("off")
    if img2.ndim == 3:
        b, g, r = cv2.split(img2)
        img2 = cv2.merge([r, g, b])
        plt.subplot(122), plt.imshow(img2), plt.axis("off")
    else:
        plt.subplot(122), plt.imshow(img2, cmap='gray'), plt.axis("off")
    plt.show()

其中 plt.subplot(121) 就代表一行两列图像中的第一个。

编写计算机视觉程序时可以使用上述函数将中间过程图像显示出来,方便观察与调试。例如:

这里写图片描述

  • 9
    点赞
  • 51
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: 基于opencv-python的车牌识别是一种利用计算机视觉技术实现的车牌自动识别系统,通过将车牌图像输入到系统中,利用opencv-python库中的图像处理算法和人工智能算法进行处理,最终得到车牌号码。 云盘下载是指将该系统提供的代码和相关文件上传到云盘,方便用户下载和使用。由于该系统所需的文件较大,因此使用云盘下载可以更加方便和快捷。 基于opencv-python的车牌识别的优点是准确度高,识别速度快,且能够适应不同光照和角度的情况,因此具有广泛的应用价值。例如,在道路交通安全管理中,可以利用该系统自动识别车牌号码,提高交通事故的处理效率;在车辆卡口管理中,可以利用该系统对过往车辆进行车牌识别,实现自动化的流量统计和监管。 总之,基于opencv-python的车牌识别是一种实用的计算机视觉技术,通过云盘下载可以更加方便快捷地实现应用。 ### 回答2: 基于opencv-python的车牌识别是一种使用Python编程语言和OpenCV计算机视觉库进行车牌识别的技术。这种技术可以通过静态图像或视频流识别车牌,以实现智能交通、车辆管理等目的。这种技术在实际应用中可以提高车辆追踪的效率,减少违章交通行为和交通事故的发生。 在进行车牌识别时,需要通过使用Python编程语言和OpenCV图像处理工具对图片进行处理,从而检测出车牌的位置和角度。接下来,需要使用深度学习算法对检测到的车牌信息进行识别,并将车牌中的字符进行提取和解析。 为方便下载和使用,可以将车牌识别的代码和所需的依赖文件打包成一个ZIP或RAR文件,并上传到云盘中。这样,用户可以通过下载并解压缩文件来快速使用车牌识别技术,同时可以在实际应用中根据需要进行二次开发和优化。近年来,车牌识别技术在智能交通和社会管理领域得到广泛应用,帮助提高城市管理和公共安全管理水平。 ### 回答3: 基于opencv-python的车牌识别是一种将图像处理技术应用于车牌识别的方法,利用opencv-python这一开源计算机视觉库,结合现代物联网技术,可实现快速、精准、高效的车牌识别。 在使用基于opencv-python的车牌识别前,我们需要在云盘上下载相关程序,安装好opencv-python和其他相关依赖库。在准备工作完成后,我们可以将待识别的车牌图像导入到识别系统中。车牌图像可以是通过摄像头获取的实时图像,也可以是已保存在本地的图片。 基于opencv-python的车牌识别系统会自动对车牌图像进行预处理,包括二值化、去噪、定位等步骤。在车牌图像预处理完成后,系统会提取车牌上的字符信息,并基于机器学习算法对字符进行识别。最终,系统将结果输出到显示屏上,同时也可以保存到计算机本地或者上传到云端进行存储。 基于opencv-python的车牌识别技术已经日益成熟,应用也越来越广泛。在交通管理、车辆识别、停车管理等领域都可以发挥重要作用。与传统的车牌识别技术相比,基于opencv-python的车牌识别技术更加精准、高效、便捷。随着互联网技术的不断发展和普及,相信这一技术的应用前景将会更加广阔。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值