Python实现im2col和col2im函数

今天来说说im2col和col2im函数,这是MATLAB中两个内置函数,经常用于数字图像处理中。其中im2col函数在《MATLAB中的im2col函数》一文中已经进行了简单的介绍。

一般来说:

  • 如是将图像分割成块的时候用的im2col参数为’distinct’,那么用col2im函数时参数也是’distinct’,即可将转换后的数组复原。
  • 如果将图像分割成块的时候用的im2col参数为’sliding’,我目前还不知道MATLAB中使用内置函数是如何复原的。

今天,来看看Python中是如何实现这两个函数的(sliding类型)。

  • 对于im2col的实现,我们沿着原始矩阵逐行计算,将得到的新的子矩阵展开成列,放置在列块矩阵中。
  • 对于col2im的实现,我们沿着列块矩阵逐行计算,将得到的行展成子矩阵,然后将子矩阵放置在最终结果对应的位置(每次当前值进行相加),同时记录每个位置的值放置的次数。最后,将当前位置的值除以放置的次数,即可得到结果(原始矩阵)。
'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:579817333 
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
def im2col(mtx, block_size):
    mtx_shape = mtx.shape
    sx = mtx_shape[0] - block_size[0] + 1
    sy = mtx_shape[1] - block_size[1] + 1
    # 如果设A为m×n的,对于[p q]的块划分,最后矩阵的行数为p×q,列数为(m−p+1)×(n−q+1)。
    result = np.empty((block_size[0] * block_size[1], sx * sy))
    # 沿着行移动,所以先保持列(i)不动,沿着行(j)走
    for i in range(sy):
        for j in range(sx):
            result[:, i * sx + j] = mtx[j:j + block_size[0], i:i + block_size[1]].ravel(order='F')
    return result


def col2im(mtx, image_size, block_size):
    p, q = block_size
    sx = image_size[0] - p + 1
    sy = image_size[1] - q + 1
    result = np.zeros(image_size)
    weight = np.zeros(image_size)  # weight记录每个单元格的数字重复加了多少遍
    col = 0
    # 沿着行移动,所以先保持列(i)不动,沿着行(j)走
    for i in range(sy):
        for j in range(sx):
            result[j:j + p, i:i + q] += mtx[:, col].reshape(block_size, order='F')
            weight[j:j + p, i:i + q] += np.ones(block_size)
            col += 1
    return result / weight

测试代码:

'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:579817333 
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
if __name__ == '__main__':
    mtx = np.around(np.random.rand(5, 5) * 100)
    print('原始矩阵:')
    print(mtx)

    a1 = im2col(mtx, (2, 3))
    print('im2col(分块大小2x3):')
    print(a1)
    b1 = col2im(a1, (5, 5), (2, 3))
    print('col2im复原:')
    print(b1)

    a2 = im2col(mtx, (3, 3))
    print('im2col(分块大小3x3):')
    print(a2)
    b2 = col2im(a2, (5, 5), (3, 3))
    print('col2im复原:')
    print(b2)

运行结果:

原始矩阵:
[[ 48.  38.  38.  59.  38.]
 [ 38.  11.  25.  52.  44.]
 [ 60.  69.  49.  93.  66.]
 [ 88.   8.  47.  14.  47.]
 [ 96.  37.  56.  86.  54.]]
im2col(分块大小2x3):
[[ 48.  38.  60.  88.  38.  11.  69.   8.  38.  25.  49.  47.]
 [ 38.  60.  88.  96.  11.  69.   8.  37.  25.  49.  47.  56.]
 [ 38.  11.  69.   8.  38.  25.  49.  47.  59.  52.  93.  14.]
 [ 11.  69.   8.  37.  25.  49.  47.  56.  52.  93.  14.  86.]
 [ 38.  25.  49.  47.  59.  52.  93.  14.  38.  44.  66.  47.]
 [ 25.  49.  47.  56.  52.  93.  14.  86.  44.  66.  47.  54.]]
col2im复原:
[[ 48.  38.  38.  59.  38.]
 [ 38.  11.  25.  52.  44.]
 [ 60.  69.  49.  93.  66.]
 [ 88.   8.  47.  14.  47.]
 [ 96.  37.  56.  86.  54.]]
im2col(分块大小3x3):
[[ 48.  38.  60.  38.  11.  69.  38.  25.  49.]
 [ 38.  60.  88.  11.  69.   8.  25.  49.  47.]
 [ 60.  88.  96.  69.   8.  37.  49.  47.  56.]
 [ 38.  11.  69.  38.  25.  49.  59.  52.  93.]
 [ 11.  69.   8.  25.  49.  47.  52.  93.  14.]
 [ 69.   8.  37.  49.  47.  56.  93.  14.  86.]
 [ 38.  25.  49.  59.  52.  93.  38.  44.  66.]
 [ 25.  49.  47.  52.  93.  14.  44.  66.  47.]
 [ 49.  47.  56.  93.  14.  86.  66.  47.  54.]]
col2im复原:
[[ 48.  38.  38.  59.  38.]
 [ 38.  11.  25.  52.  44.]
 [ 60.  69.  49.  93.  66.]
 [ 88.   8.  47.  14.  47.]
 [ 96.  37.  56.  86.  54.]]
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
im2col是一个常用的图像处理函数,用于将输入的图像转换为矩阵形式。它的作用是将图像的每个局部区域(通常是滑动窗口)转换为一列,并将所有列按顺序排列成一个矩阵。 具体来说,im2col函数接受三个参数:输入图像、滑动窗口大小和步幅。它首先根据滑动窗口大小和步幅计算出输出矩阵的大小,然后遍历输入图像的每个局部区域,将每个区域展开为一列,并按顺序排列在输出矩阵中。 下面是一个示例代码: ```python import numpy as np def im2col(input_image, window_size, stride): # 计算输出矩阵的大小 output_height = (input_image.shape[0] - window_size) // stride + 1 output_width = (input_image.shape[1] - window_size) // stride + 1 # 创建输出矩阵 output_matrix = np.zeros((window_size * window_size, output_height * output_width)) # 遍历输入图像的每个局部区域 for i in range(output_height): for j in range(output_width): # 获取当前局部区域 local_region = input_image[i*stride:i*stride+window_size, j*stride:j*stride+window_size] # 将局部区域展开为一列,并按顺序排列在输出矩阵中 output_matrix[:, i*output_width+j] = local_region.flatten() return output_matrix ``` 这段代码实现了一个简单的im2col函数。它接受一个输入图像、滑动窗口大小和步幅作为参数,并返回一个展开后的矩阵。 使用im2col函数可以方便地对图像进行卷积操作。通过将输入图像转换为矩阵形式,可以使用矩阵乘法来实现卷积运算,从而提高计算效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值