python图像处理——图像形变与缩放

最新推荐文章于 2025-05-15 17:20:27 发布

gufeng_1992

最新推荐文章于 2025-05-15 17:20:27 发布

阅读量9.1k

点赞数 1

分类专栏： python 文章标签：图像处理 python

python 专栏收录该内容

25 篇文章

订阅专栏

本文介绍Skimage库中transform模块的功能，包括图片尺寸调整、按比例缩放、图像旋转及图像金字塔实现等操作，并通过示例代码展示具体应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

图像的形变与缩放，使用的是skimage的transform模块，函数比较多，功能齐全。
1、改变图片尺寸
函数格式为：
skimage.transform.resize(image,output_shape)
image:需要改变尺寸的图片
output_shape:新的图片尺寸

from skimage import transform,data
import matplotlib.pyplot as plt
img = data.camera()
dst=transform.resize(img, (80, 60))
plt.figure('resize')

plt.subplot(121)
plt.title('before resize')
plt.imshow(img,plt.cm.gray)

plt.subplot(122)
plt.title('before resize')
plt.imshow(dst,plt.cm.gray)

plt.show()

可以看到简爱嗯图片由原来512×512，变成来80×60。
这里写图片描述

2 按比例缩放
函数格式为：
skimage.transform.resize(image,scale[…..])
scale参数可以是单个floate数，表示缩放的倍数，也可是floate型tuple，如[0.2,0.5]表示将行列分开进行缩放。

from skimage import transform,data
img = data.camera()
print(img.shape)  #图片原始大小 
print(transform.rescale(img, 0.1).shape)  #缩小为原来图片大小的0.1倍
print(transform.rescale(img, [0.5,0.25]).shape)  #缩小为原来图片行数一半，列数四分之一
print(transform.rescale(img, 2).shape)   #放大为原来图片大小的2倍

3、旋转rotate
skimage.transform.rotate(image,angle[,…],resize=False)
angle参数是一个float类型，表示旋转度数
resize用于控制在旋转时，是否改变大小，默认为False

from skimage import transform,data
import matplotlib.pyplot as plt
img = data.camera()
print(img.shape)  #图片原始大小
img1=transform.rotate(img, 60) #旋转90度，不改变大小 
print(img1.shape)
img2=transform.rotate(img, 30,resize=True)  #旋转30度，同时改变大小
print(img2.shape)   

plt.figure('resize')

plt.subplot(121)
plt.title('rotate 60')
plt.imshow(img1,plt.cm.gray)

plt.subplot(122)
plt.title('rotate  30')
plt.imshow(img2,plt.cm.gray)

plt.show()

4、图像金字塔
以多分辨率来解释图像的一种有效但概念简单的结构就是图像金字塔。图像金字塔最初用于机器视觉和图像压缩，一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低的图像集合。金字塔的底部是待处理图像的高分辨率表示，而顶部是低分辨率的近似。当向金字塔的上层移动时，尺寸和分辨率就降低。

在此，我们举一个高斯金字塔的应用实例，函数原型为：

skimage.transform.pyramid_gaussian(image, downscale=2)

import numpy as np
import matplotlib.pyplot as plt
from skimage import data,transform

image = data.astronaut()  #载入宇航员图片
rows, cols, dim = image.shape  #获取图片的行数，列数和通道数
pyramid = tuple(transform.pyramid_gaussian(image, downscale=2))  #产生高斯金字塔图像
#共生成了log(512)=9幅金字塔图像，加上原始图像共10幅，pyramid[0]-pyramid[1]

composite_image = np.ones((rows, cols + cols / 2, 3), dtype=np.double)  #生成背景

composite_image[:rows, :cols, :] = pyramid[0]  #融合原始图像

i_row = 0
for p in pyramid[1:]:
    n_rows, n_cols = p.shape[:2]
    composite_image[i_row:i_row + n_rows, cols:cols + n_cols] = p  #循环融合9幅金字塔图像
    i_row += n_rows

plt.imshow(composite_image)
plt.show()