【python】PIL(下)

参考:

上一篇:

转载+整理+扩充:



PIL 模块全称为 Python Imaging Library,是python中一个免费的图像处理模块。
在这里插入图片描述

1 导数,梯度,边缘信息

在数学中,与变化率有关的就是导数。
如果灰度图像的像素是连续的(实际不是),那么我们可以分别原图像 G G G x x x 方向和 y y y 方向求导数 G x = ∂ G ∂ x G_x = \frac{\partial G}{\partial x} Gx=xG G y = ∂ G ∂ y G_y = \frac{\partial G}{\partial y} Gy=yG
获得 x x x 方向的导数图像 G x G_x Gx y y y 方向的导数图像 G y G_y Gy G x G_x Gx G y G_y Gy 分别隐含了 x x x y y y 方向的灰度变化信息,也就隐含了边缘信息。如果要在同一图像上包含两个方向的边缘信息,我们可以用到梯度。(梯度是一个向量)
原图像的梯度向量 G x y G_{xy} Gxy为( G x G_x Gx, G y G_y Gy),梯度向量的大小和方向可以用下面两个式子计算
∣ G x y ∣ = G x 2 + G y 2 \left | G_{xy} \right |=\sqrt{G_{x}^{2} + G_{y}^{2}} Gxy=Gx2+Gy2 ∠ G x y = a r c t a n ( G y G x ) \angle G_{xy} = arctan\left ( \frac{G_{y}}{G_{x}} \right ) Gxy=arctan(GxGy)

  • 角度值好像需要根据向量所在象限不同适当 + π \pi π 或者 - π \pi π
  • 梯度向量大小就包含了 x x x 方向和 y y y 方向的边缘信息。

2 图像导数

实际上,图像矩阵是离散的。连续函数求变化率用的是导数,而离散函数求变化率用的是差分。差分的概念很容易理解,就是用相邻两个数的差来表示变化率。
实际计算图像导数时,我们是通过原图像和一个算子进行卷积来完成的(这种方法是求图像的近似导数)。最简单的求图像导数的算子是 Prewitt 算子 :
x x x 方向的 Prewitt 算子为: [ − 1 0 1 − 1 0 1 − 1 0 1 ] \begin{bmatrix} -1 & 0& 1\\ -1 & 0& 1\\ -1 & 0& 1 \end{bmatrix} 111000111

y y y 方向的 Prewitt 算子为: [ − 1 − 1 − 1 0 0 0 1 1 1 ] \begin{bmatrix} -1 & -1& -1\\ 0 & 0& 0\\ 1 & 1& 1 \end{bmatrix} 101101101

卷积过程如下(准确来说是相关,don’t care),虚线表示 padding 部分,下面蓝色的是原图,上面绿色的是卷积以后的图,下面滑动的9宫格就是我们定义的 x x x 方向的 Prewitt 算子、 y y y 方向的 Prewitt 算子
这里写图片描述

因此,利用原图像和 x x x 方向 Prewitt 算子进行卷积就可以得到图像的 x x x 方向导数矩阵 G x G_x Gx,利用原图像和 y y y 方向 Prewitt 算子进行卷积就可以得到图像的 y y y 方向导数矩阵 G y G_y Gy

利用公式 ∣ G x y ∣ = G x 2 + G y 2 \left | G_{xy} \right |=\sqrt{G_{x}^{2} + G_{y}^{2}} Gxy=Gx2+Gy2 ,就可以得到图像的梯度矩阵 G x y G_{xy} Gxy,这个矩阵包含图像 x x x 方向和 y y y 方向的边缘信息。

3 Prewitt 算子的边缘检测

实际上,scipy库中的signal模块含有一个二维卷积的方法 convolve2d() ,造轮子可以参考博客【计算机视觉】卷积、均值滤波、高斯滤波、Sobel算子、Prewitt算子(Python实现)

3.1 造轮子

1)定义卷积

import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
# 卷积
def imgConvolve(image, kernel):
    '''
    :param image: 图片矩阵
    :param kernel: 滤波窗口
    :return:卷积后的矩阵
    '''
    img_h = int(image.shape[0])
    img_w = int(image.shape[1])
    kernel_h = int(kernel.shape[0])
    kernel_w = int(kernel.shape[1])
    # padding
    padding_h = int((kernel_h - 1) / 2)
    padding_w = int((kernel_w - 1) / 2)

    convolve_h = int(img_h + 2 * padding_h)
    convolve_W = int(img_w + 2 * padding_w)

    # 分配空间
    img_padding = np.zeros((convolve_h, convolve_W))
    # 中心填充图片
    img_padding[padding_h:padding_h + img_h, padding_w:padding_w + img_w] = image[:, :]
    # 卷积结果
    image_convolve = np.zeros(image.shape)
    # 卷积
    for i in range(padding_h, padding_h + img_h):
        for j in range(padding_w, padding_w + img_w):
            image_convolve[i - padding_h][j - padding_w] = int(
                np.sum(img_padding[i - padding_h:i + padding_h+1, j - padding_w:j + padding_w+1]*kernel))

    return image_convolve

2)定义算子

# x方向的Prewitt算子
operator_x = np.array([[-1, 0, 1],
                       [ -1, 0, 1],
                       [ -1, 0, 1]])
# y方向的Prewitt算子
operator_y = np.array([[-1,-1,-1],
                       [ 0, 0, 0],
                       [ 1, 1, 1]])

3)计算并可视化结果

image = Image.open("C://Users/13663//Desktop/1.jpg").convert("L")
image_array = np.array(image)
image_x = imgConvolve(image_array,operator_x)
image_y = imgConvolve(image_array,operator_y)
image_xy = np.sqrt(image_x**2+image_y**2)
# 绘出图像,灰度图
plt.subplot(2,2,1)
plt.imshow(image_array,cmap='gray')
plt.title('the grey-scale image',size=15,color='w')
plt.axis("off")
# x 方向的梯度
plt.subplot(2,2,2)
plt.imshow(image_x,cmap='gray')
plt.title('the derivative of x',size=15,color='w')
plt.axis("off")
# y 方向导数图像
plt.subplot(2,2,3)
plt.imshow(image_y,cmap='gray')
plt.title('the derivative of y',size=15,color='w')
plt.axis("off")
# 梯度图像
plt.subplot(2,2,4)
plt.imshow(image_xy,cmap='gray')
plt.title('the gradient of image',size=15,color='w')
plt.axis("off")
plt.show()

在这里插入图片描述 在这里插入图片描述

3.2 它山之石可以攻玉

调用 scipy 中的 signal.convolve2d

import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
import scipy.signal as signal     # 导入sicpy的signal模块
# x方向的Prewitt算子
operator_x = np.array([[-1, 0, 1],
                       [ -1, 0, 1],
                       [ -1, 0, 1]])
# y方向的Prewitt算子
operator_y = np.array([[-1,-1,-1],
                       [ 0, 0, 0],
                       [ 1, 1, 1]])

# 打开图像并转化成灰度图像
image = Image.open("C://Users/13663//Desktop/2.jpg").convert("L")
image_array = np.array(image)
# 利用signal的convolve计算卷积
image_x = signal.convolve2d(image,operator_x,mode="same")
image_y = signal.convolve2d(image,operator_y,mode="same")
image_xy = np.sqrt(image_x**2+image_y**2)
# 绘出图像,灰度图
plt.subplot(2,2,1)
plt.imshow(image_array,cmap='gray')
plt.title('the grey-scale image',size=15,color='w')
plt.axis("off")
# x 方向的梯度
plt.subplot(2,2,2)
plt.imshow(image_x,cmap='gray')
plt.title('the derivative of x',size=15,color='w')
plt.axis("off")
# y 方向导数图像
plt.subplot(2,2,3)
plt.imshow(image_y,cmap='gray')
plt.title('the derivative of y',size=15,color='w')
plt.axis("off")
# 梯度图像
plt.subplot(2,2,4)
plt.imshow(image_xy,cmap='gray')
plt.title('the gradient of image',size=15,color='w')
plt.axis("off")
plt.show()

在这里插入图片描述

对比下造轮子和调用的结果
在这里插入图片描述 在这里插入图片描述
左边是造轮子的结果,右边是调用的结果,会注意到 the derivative of xthe derivative of y 中略有差异,粗略的看造轮子中是黑线(0),而调用中是白线(255),仔细对比发现,他们各个位置的像素值好像是互补的(相加=255),输出卷积后数组最大值和最小值会发现

print(image_x.max())
print(image_x.min())

造轮子的 output 为

411.0
-477.0

调用的 output 为

477
-411

哈哈哈,确实是正好反过来了,matplotlib 画图时会归一化到0-255,所以两者在可视化中互补为255,nice
修改造轮子代码中 def imgConvolve(image, kernel): 函数的输出为原来的相反数 return -image_convolve,再试试
在这里插入图片描述 在这里插入图片描述
左边为造轮子代码,右边为调用的代码,ok,一样了

4 Sobel 算子的边缘检测

修改下 operator 即可

# x方向的Sobel算子
operator_x = np.array([[-1, 0, 1],
                       [ -2, 0, 2],
                       [ -1, 0, 1]])
# y方向的Sobel算子
operator_y = np.array([[-1,-2,-1],
                       [ 0, 0, 0],
                       [ 1, 2, 1]])

在这里插入图片描述

5 Laplace 算子

Laplace 算子是一个二阶导数的算子,它实际上是一个 x x x 方向二阶导数和 y y y 方向二阶导数的和的近似求导算子。实际上,Laplace算子是通过Sobel算子推导出来的。
Laplace算子为 [ 0 1 0 1 − 4 1 0 1 0 ] \begin{bmatrix} 0 & 1& 0\\ 1 & -4& 1\\ 0 & 1& 0 \end{bmatrix} 010141010

Laplace还有一种扩展算子为 [ 1 1 1 1 − 8 1 1 1 1 ] \begin{bmatrix} 1 & 1& 1\\ 1 & -8& 1\\ 1 & 1& 1 \end{bmatrix} 111181111

import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
import scipy.signal as signal     # 导入sicpy的signal模块

# Laplace算子
Laplace1 = np.array([[0, 1, 0],  
                    [1,-4, 1],
                    [0, 1, 0]])

# Laplace扩展算子
Laplace2 = np.array([[1, 1, 1],
                    [1,-8, 1],
                    [1, 1, 1]])

# 打开图像并转化成灰度图像
image = Image.open("C://Users/13663//Desktop/2.jpg").convert("L")
image_array = np.array(image)

# 利用signal的convolve计算卷积
image_1 = signal.convolve2d(image,Laplace1,mode="same")
image_2 = signal.convolve2d(image,Laplace2,mode="same")

可视化结果
在这里插入图片描述
laplace 1

plt.imshow(image_1,cmap='gray')
plt.title('laplace 1',size=15,color='w')
plt.axis("off")
plt.show()

laplace 2

plt.imshow(image_2,cmap='gray')
plt.title('laplace 2',size=15,color='w')
plt.axis("off")
plt.show()

在这里插入图片描述 在这里插入图片描述
视觉效果不是很好,我们加点内容

# 将卷积结果转化成0~255
image_1 = (image_1/float(image_1.max()))*255
image_2 = (image_2/float(image_2.max()))*255

# 为了使看清边缘检测结果,将大于灰度平均值的灰度变成255(白色)
image_1[image_1>image_1.mean()] = 255
image_2[image_2>image_2.mean()] = 255

在这里插入图片描述 在这里插入图片描述
看另外一个例子
在这里插入图片描述
在这里插入图片描述 在这里插入图片描述
改进视觉效果
在这里插入图片描述 在这里插入图片描述

6 Gaussian + Laplace

先来个 Gaussian 模糊,然后再 滤波
G ( x , y ) = 1 2 π σ e − ( x 2 + y 2 ) 2 σ 2 G\left ( x,y \right )=\frac{1}{2\pi \sigma }e^{\frac{-\left ( x^{2}+y^{2} \right )}{2\sigma^{2} }} G(x,y)=2πσ1e2σ2(x2+y2)

import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
import scipy.signal as signal

# 乘以100是为了使算子中的数便于观察
# sigma指定高斯算子的标准差

# 生成高斯算子的函数
def func(x,y,sigma=1):
    return 100*(1/(2*np.pi*sigma))*np.exp(-((x-2)**2+(y-2)**2)/(2.0*sigma**2))

# 生成标准差为5的5*5高斯算子
gaussian = np.fromfunction(func,(5,5),sigma=5)

# Laplace扩展算子
laplace2 = np.array([[1, 1, 1],
                     [1,-8, 1],
                     [1, 1, 1]])

# 打开图像并转化成灰度图像
image = Image.open("C://Users/13663//Desktop/1.jpg").convert("L")
image_array = np.array(image)

# 利用生成的高斯算子与原图像进行卷积对图像进行平滑处理
image_blur = signal.convolve2d(image_array, gaussian, mode="same")

# 对平滑后的图像进行边缘检测
image2 = signal.convolve2d(image_blur, laplace2, mode="same")

# 显示图像
plt.imshow(image2,cmap='gray')
plt.axis("off")
plt.title('gaussian + laplace 2',size=15,color='w')
plt.show()

在这里插入图片描述
增进下视觉效果,在 image2 = signal.convolve2d(image_blur, laplace2, mode="same") 后加入以下代码

# 结果转化到0-255
image2 = (image2/float(image2.max()))*255

# 将大于灰度平均值的灰度值变成255(白色),便于观察边缘
image2[image2>image2.mean()] = 255

在这里插入图片描述
再改下 gaussian = np.fromfunction(func,(3,3),sigma=3)
在这里插入图片描述
换个图片看看效果
在这里插入图片描述
在这里插入图片描述 在这里插入图片描述
在这里插入图片描述 在这里插入图片描述
gaussian + laplace 2 w/o 100 表示计算高斯核的时候,没有乘以 100

7 多张图合并成一张

下面以 ReID 公开数据集为例,将图片 resize 成固定 128x64 大小,50个图片一组合成 640x640 的大图

参考

Python3学习(二):把一个列表按指定数目分成多个列表

Python将多张图片进行合并拼接

import PIL.Image as Image
import os

row = 5   # 大图由 row 行子图构成
col = 10  # 大图由 col 列子图构成
size = (128, 64)  # h,w 设定每个子图的大小

pth = "./dukemtmc/" # 子图路径
target_pth = "./cuhk03/"  # 保存的大图路径

# 把图片列表 init_list 划分为定长的子列表,每个子列表长度为 children_list_len,
# 例如 [1,2,3,4,5,6,7,8,9] 划分为子列表长度为 3 的列表 [[1,2,3], [4,5,6], [7,8,9]]
def list_of_groups(init_list, children_list_len):
    list_of_groups = zip(*(iter(init_list),) *children_list_len)
    end_list = [list(i) for i in list_of_groups]
    count = len(init_list) % children_list_len
    end_list.append(init_list[-count:]) if count !=0 else end_list
    return end_list


if not os.path.exists(target_pth):
    os.makedirs(target_pth)

# one catalog
imgs = os.listdir(pth) # 如果文件结构不复杂,所有图片都在一个文件夹中可以简单的通过 os.listdir 来获取图片列表

imgs = sorted(imgs) # 把图片简单的排序下,这样合成的大图有规律一些
imgs_split = list_of_groups(imgs, row*col)


for i, img_split in enumerate(imgs_split):
    if len(img_split) == row * col:  # 把 row*col 张图片合成一张图
        to_image = Image.new("RGB", (row * size[0], col * size[1]))  # 创建新的大图
        for y in range(1, row + 1):
            for x in range(1, col + 1):
            	# one catalog 
                from_image = Image.open(os.path.join(pth, img_split[col*(y-1)+x-1])).resize((size[1], size[0]), Image.ANTIALIAS) # 打开子图
                to_image.paste(from_image, ((x-1)*size[1], (y-1)*size[0]))  # 把子图贴到大图
        to_image.save(os.path.join(target_pth, "dukemtmc_"+str(i)+".jpg"))  # 保存大图
    else: # 余下的图片不足 row*col 张
        print("images is not enough")

效果如下

在这里插入图片描述


如果图片分布在各个文件夹中,可以借助 os.walk 方式来获取图片列表,如下所示(仅改变了图片列表获取的写法和读取子图的路径写法)

import PIL.Image as Image
import os

row = 5   # 大图由 row 行子图构成
col = 10  # 大图由 col 列子图构成
size = (128, 64)  # h,w 设定每个子图的大小

pth = "./dukemtmc/" # 子图路径
target_pth = "./cuhk03/"  # 保存的大图路径


def list_of_groups(init_list, children_list_len):
    list_of_groups = zip(*(iter(init_list),) *children_list_len)
    end_list = [list(i) for i in list_of_groups]
    count = len(init_list) % children_list_len
    end_list.append(init_list[-count:]) if count !=0 else end_list
    return end_list


if not os.path.exists(target_pth):
    os.makedirs(target_pth)

# many catalog
imgs = []
for roots, _, files in os.walk(pth):
    for file in files:
        if os.path.splitext(file)[1] in ['.jpg', '.png', '.JPG', '.PNG']:
            imgs.append(os.path.join(roots, file))
            
imgs = sorted(imgs)
imgs_split = list_of_groups(imgs, row*col)

for i, img_split in enumerate(imgs_split):
    if len(img_split) == row * col:  # 把 row*col 张图片合成一张图
        to_image = Image.new("RGB", (row * size[0], col * size[1]))  # 创建新的大图
        for y in range(1, row + 1):
            for x in range(1, col + 1):
                # many catalog
                from_image = Image.open(img_split[col * (y - 1) + x - 1]).resize((size[1], size[0]), Image.ANTIALIAS) # 打开子图
                to_image.paste(from_image, ((x-1)*size[1], (y-1)*size[0]))  # 把子图贴到大图
        to_image.save(os.path.join(target_pth, "dukemtmc_"+str(i)+".jpg"))  # 保存大图
    else: # 余下的图片不足 row*col 张
        print("images is not enough")

8 判断图像是否为灰度图

来自 python 判断灰度图像

from PIL import Image
def isGrayMap(img, threshold = 15):
    """
    入参:
    img:PIL读入的图像
    threshold:判断阈值,图片3个通道间差的方差均值小于阈值则判断为灰度图。
    阈值设置的越小,容忍出现彩色面积越小;设置的越大,那么就可以容忍出现一定面积的彩色,例如微博截图。
    如果阈值设置的过小,某些灰度图片会被漏检,这是因为某些黑白照片存在偏色,例如发黄的黑白老照片、
    噪声干扰导致灰度图不同通道间值出现偏差(理论上真正的灰度图是RGB三个通道的值完全相等或者只有一个通道,
    然而实际上各通道间像素值略微有偏差看起来仍是灰度图)
    出参:
    bool值
    """
    if len(img.getbands()) == 1:
        return True
    img1 = np.asarray(img.getchannel(channel=0), dtype=np.int16)
    img2 = np.asarray(img.getchannel(channel=1), dtype=np.int16)
    img3 = np.asarray(img.getchannel(channel=2), dtype=np.int16)
    diff1 = (img1 - img2).var()
    diff2 = (img2 - img3).var()
    diff3 = (img3 - img1).var()
    diff_sum = (diff1 + diff2 + diff3) / 3.0
    if diff_sum <= threshold:
        return True
    else:
        return False

九宫格

代码来自

https://github.com/xingag/tools_python/tree/master/%E5%9B%BE%E7%89%87%E8%A7%86%E9%A2%91%E4%B9%9D%E5%AE%AB%E6%A0%BC

from PIL import Image


class ImageObj(object):
    def __init__(self):
        pass

    def start(self, file_path):
        # 1、打开图片
        image = Image.open(file_path)

        # 2、将图片填充为正方形,组成:原图+百底+正方形
        image = self.__fill_image(image)

        # 保存图片
        image.save('temp.jpg')

        # 3、裁剪合成后图片,为9张图片
        nine_images = self.__cut_image(image)

        # 4、保存9张图片到本地
        self.save_images(nine_images)

    def __cut_image(self, image):
        """
        把一张图片裁剪成9张图片的坐标值,然后进行裁剪成小图片
        :return:
        """
        width, height = image.size

        # 6000
        print('原图的宽/高分别为:', width, height)

        # 2000
        # 每张图片的宽度
        item_width = int(width / 3)

        print('裁剪后的宽度为:', item_width)

        box_list = []

        for i in range(0, 3): 
            for j in range(0, 3):
                # 坐标值分别是:左、上、右、底
                box = (j * item_width, i * item_width, (j + 1) * item_width, (i + 1) * item_width)
                print(box)
                box_list.append(box)

        # 裁剪图片
        image_list = [image.crop(box) for box in box_list]

        return image_list

    def __fill_image(self, image):
        """
        将图片填充为正方形
        :param image:
        :return:
        """
        width, height = image.size

        # 长和宽较大值,作为新图片的宽高
        new_image_length = width if width > height else height

        # 生成新图片[纯白底]
        new_image = Image.new(image.mode, (new_image_length, new_image_length), color='white')

        # 将之前的图粘贴在新图上,居中
        # 如果原图宽大于高(横图),则填充图片的竖直维度
        if width > height:
            # (x,y)二元组表示粘贴上图相对下图的起始位置
            new_image.paste(image, (0, int((new_image_length - height) / 2)))
        else:
            # 如果原图宽小于高(竖图),则填充图片的水平纬度
            new_image.paste(image, (int((new_image_length - width) / 2), 0))
        return new_image

    def save_images(self, nine_images):
        """
        保存图片
        :param nine_images:
        :return:
        """
        index = 1
        for image in nine_images:
            image.save('C://Users/Administrator/Desktop/result/' + str(index) + '.jpg')
            index += 1


if __name__ == '__main__':
    # 图片路径
    image_file_path = 'C://Users/Administrator/Desktop/1.jpg'
    image_obj = ImageObj()
    image_obj.start(image_file_path)

输入

请添加图片描述
输出
在这里插入图片描述

  • 7
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值