AIStudio扫描王实现与原理详解

最新推荐文章于 2024-09-11 01:53:41 发布

AI Studio

最新推荐文章于 2024-09-11 01:53:41 发布

阅读量1.1k

点赞数 2

文章标签： opencv 计算机视觉 python

原文链接：https://aistudio.baidu.com/aistudio/projectdetail/5453979?forkThirdPart=1

版权

本文介绍了如何使用AIStudio社区的代码实现图像的扫描件处理，通过Numpy和OpenCV进行最大滤波和最小滤波，以去除图像中的阴影和噪声。文章详细阐述了滤波原理，包括邻域滤波和频域滤波，并提供了Python代码示例，展示了如何对图像进行最大和最小值滤波，以及如何进行背景减除，从而得到清晰的扫描件效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

★★★ 本文源自AI Studio社区精品项目，【点击此处】查看更多精品内容 >>>

AIStudio扫描王实现与原理详解

一、前言

大家经常有需要使用扫描件的时候，如果是要求不太高的场景，我们通常会使用手机拍照，再经过一些APP应用的处理，就生成了扫描件。但是，通常会有广告，并且一些功能是收费的，那么我们有没有其他的办法实现这些功能呢？下面本项目将展示如何实现。

二、代码与原理

只需要将图像加载到相应的代码中，无需任何应用程序即可在几秒钟内获得输出。这个代码可以通过Numpy和OpenCV基本函数来实现。示例图片如图所示。

首先，我们需要导入库函数；其次使用滤波函数将阴影部分去除；最后输出需要的图像文件。那么什么是图像滤波呢？下面简单介绍一下图片滤波。

图像滤波，即在尽量保留图像细节特征的条件下对目标图像的噪声进行抑制，是图像预处理中不可缺少的操作，其处理效果的好坏将直接影响到后续图像处理和分析的有效性和可靠性[1]。

图像滤波按图像域可分为两种类型：

邻域滤波(Spatial Domain Filter)，其本质是数字窗口上的数学运算。一般用于图像平滑、图像锐化、特征提取(如纹理测量、边缘检测)等，邻域滤波使用邻域算子——利用给定像素周围像素值以决定此像素最终输出的一种算子。邻域滤波方式又分为线性滤波和非线性滤波，其中线性滤波包括均值滤波、方框滤波和高斯滤波等，非线性滤波包括中值滤波和双边滤波等。

频域滤波(Frequency Domain Filter)，其本质是对像素频率的修改。一般用于降噪、重采样、图像压缩等。按图像频率滤除效果主要分为两种类型：低通滤波（滤除原图像的高频成分，即模糊图像边缘与细节）和高通滤波（滤除原图像的低频成分，即图像锐化）。

[1]图像滤波参考链接：https://blog.csdn.net/crossoverpptx/article/details/127307179

%matplotlib inline

import cv2
import numpy as np
import matplotlib.pyplot as plt

2.1 最大滤波

最大最小值滤波是一种比较保守的图像处理手段，与中值滤波类似，首先要排序周围像素和中心像
素值，然后将中心像素值与最小和最大像素值比较，如果比最小值小，则替换中心像素为最小值，
如果中心像素比最大值大，则替换中心像素为最大值。

让我们假设我们有一定大小的图像I。我们编写的算法应该逐个遍历I的像素，并且对于每个像素（x，y），它必须找到该像素周围的邻域（大小为N x N的窗口）中的最大灰度值，并进行写入A中相应像素位置（x，y）的最大灰度值。所得图像A称为输入图像I的最大滤波图像。现在让我们通过代码来实现这个概念。

max_filtering（）函数接受输入图像和窗口大小N。
它最初在输入数组周围创建一个“墙”（带有-1的填充），当我们遍历边缘像素时会有所帮助。
然后，我们创建一个“ temp”变量，将计算出的最大值复制到其中。
然后，我们遍历该数组并围绕大小为N x N的当前像素创建一个窗口。
然后，我们使用“ amax（）”函数在该窗口中计算最大值，并将该值写入temp数组。
我们将该临时数组复制到主数组A中，并将其作为输出返回。
A是输入I的最大滤波图像。

def max_filtering(N, I_temp):
    wall = np.full((I_temp.shape[0]+(N//2)*2, I_temp.shape[1]+(N//2)*2), -1)
    wall[(N//2):wall.shape[0]-(N//2), (N//2):wall.shape[1]-(N//2)] = I_temp.copy()
    temp = np.full((I_temp.shape[0]+(N//2)*2, I_temp.shape[1]+(N//2)*2), -1)
    for y in range(0,wall.shape[0]):
        for x in range(0,wall.shape[1]):
            if wall[y,x]!=-1:
                window = wall[y-(N//2):y+(N//2)+1,x-(N//2):x+(N//2)+1]
                num = np.amax(window)
                temp[y,x] = num
    A = temp[(N//2):wall.shape[0]-(N//2), (N//2):wall.shape[1]-(N//2)].copy()
    return A

2.2 最小滤波

最小滤波：此算法与最大滤波完全相同，但是我们没有找到附近的最大灰度值，而是在该像素周围的N x N邻域中找到了最小值，并将该最小灰度值写入B中的（x，y）。所得图像B称为图像I的经过最小滤波的图像，代码如下。

def min_filtering(N, A):
    wall_min = np.full((A.shape[0]+(N//2)*2, A.shape[1]+(N//2)*2), 300)
    wall_min[(N//2):wall_min.shape[0]-(N//2), (N//2):wall_min.shape[1]-(N//2)] = A.copy()
    temp_min = np.full((A.shape[0]+(N//2)*2, A.shape[1]+(N//2)*2), 300)
    for y in range(0,wall_min.shape[0]):
        for x in range(0,wall_min.shape[1]):
            if wall_min[y,x]!=300:
                window_min = wall_min[y-(N//2):y+(N//2)+1,x-(N//2):x+(N//2)+1]
                num_min = np.amin(window_min)
                temp_min[y,x] = num_min
    B = temp_min[(N//2):wall_min.shape[0]-(N//2), (N//2):wall_min.shape[1]-(N//2)].copy()
    return B

变量N（用于过滤的窗口大小）将根据图像中粒子或内容的大小进行更改。对于测试图像，选择大小N = 20。增强后的最终输出图像如下所示：

def background_subtraction(I, B):
    O = I - B
    norm_img = cv2.normalize(O, None, 0,255, norm_type=cv2.NORM_MINMAX)
    return norm_img

完整代码如下所示

%matplotlib inline

import cv2
import numpy as np
import matplotlib.pyplot as plt

def max_filtering(N, I_temp):
    wall = np.full((I_temp.shape[0]+(N//2)*2, I_temp.shape[1]+(N//2)*2), -1)
    wall[(N//2):wall.shape[0]-(N//2), (N//2):wall.shape[1]-(N//2)] = I_temp.copy()
    temp = np.full((I_temp.shape[0]+(N//2)*2, I_temp.shape[1]+(N//2)*2), -1)
    for y in range(0,wall.shape[0]):
        for x in range(0,wall.shape[1]):
            if wall[y,x]!=-1:
                window = wall[y-(N//2):y+(N//2)+1,x-(N//2):x+(N//2)+1]
                num = np.amax(window)
                temp[y,x] = num
    A = temp[(N//2):wall.shape[0]-(N//2), (N//2):wall.shape[1]-(N//2)].copy()
    return A

def min_filtering(N, A):
    wall_min = np.full((A.shape[0]+(N//2)*2, A.shape[1]+(N//2)*2), 300)
    wall_min[(N//2):wall_min.shape[0]-(N//2), (N//2):wall_min.shape[1]-(N//2)] = A.copy()
    temp_min = np.full((A.shape[0]+(N//2)*2, A.shape[1]+(N//2)*2), 300)
    for y in range(0,wall_min.shape[0]):
        for x in range(0,wall_min.shape[1]):
            if wall_min[y,x]!=300:
                window_min = wall_min[y-(N//2):y+(N//2)+1,x-(N//2):x+(N//2)+1]
                num_min = np.amin(window_min)
                temp_min[y,x] = num_min
    B = temp_min[(N//2):wall_min.shape[0]-(N//2), (N//2):wall_min.shape[1]-(N//2)].copy()
    return B

def background_subtraction(I, B):
    O = I - B
    norm_img = cv2.normalize(O, None, 0,255, norm_type=cv2.NORM_MINMAX)
    return norm_img

def min_max_filtering(M, N, I):
    if M == 0:
        #max_filtering
        A = max_filtering(N, I)
        #min_filtering
        B = min_filtering(N, A)
        #subtraction
        normalised_img = background_subtraction(I, B)
    elif M == 1:
        #min_filtering
        A = min_filtering(N, I)
        #max_filtering
        B = max_filtering(N, A)
        #subtraction
        normalised_img = background_subtraction(I, B)
    return normalised_img

P = cv2.imread('Test_image.jpeg',0)
plt.imshow(P,cmap='gray')
plt.title("original image")
plt.show()

在这里插入图片描述

#We can edit the N and M values here for P and C images
O_P = min_max_filtering(M = 0, N = 20, I = P)

#Display final output
plt.imshow(O_P, cmap = 'gray')
plt.title("Final output")
plt.show()

在这里插入图片描述

总结

进行图片转换时，有两件事要注意。由于图像是灰度图像，如果图像背景较浅且对象较暗，则必须先执行最大滤波，然后再执行最小滤波。如果图像背景较暗且物体较亮，我们可以先执行最小滤波，然后再进行最大滤波。如果图像的背景较浅，我们要先执行最大过滤，这将为我们提供增强的背景，并将该最大过滤后的图像传递给最小过滤功能。