Python图像处理-----几何变换

VIP文章优雅的心情

已于 2023-09-26 15:52:10 修改

阅读量279

点赞数

分类专栏： # python信号处理文章标签：图像处理 python 人工智能

于 2023-09-25 18:07:37 首次发布

本文链接：https://blog.csdn.net/xuefu_78/article/details/133271997

版权

文章目录

一、图像几何变换理论
二、图像平移
三、图像缩放
四、图像旋转
- 4.1 使用数学方式分析
- 4.2 使用opencv函数
五、镜像图像

一、图像几何变换理论

图像几何变换不改变图像的像素值，在图像平面上进行像素变换。适当的几
何变换可以最大程度地消除由于成像角度、透视关系乃至镜头自身原因所造成的
几何失真所产生的负面影响。几何变换常常作为图像处理应用的预处理步骤，是
图像归一化的核心工作之一[1]。
一个几何变换需要两部分运算：

空间变换：包括平移、缩放、旋转和正平行投影等，需要用它来表示输
出图像与输入图像之间的像素映射关系。
灰度插值算法：按照这种变换关系进行计算，输出图像的像素可能被映
射到输入图像的非整数坐标上[2]。

图像几何变换在变换过程中会建立一种原图像像素与变换后图像像素之间的映射关系，通过这种关系，能够从一方的像素计算出另一方的像素的坐标位置。通常将图像坐标映射到输出的过程称作向前映射，反之，将输出图像映射到输入的过程称作向后映射。向后映射在实践中使用较多，原因是能够避免使用向前映射中出现映射不完全和映射重叠的问题。

对于数字图像而言，像素的坐标是离散型非负整数，但是在进行变换的过程
中有可能产生浮点坐标值。这在图像处理中是一个无效的坐标。为了解决这个问
题需要用到插值算法。常见算法如下：

最近邻插值
双线性插值
双立方插值

图像变换是建立在矩阵运算基础上，通过矩阵运算可以很快找到对应关系。绍常见的图像几何变换，包括图形平移、图像缩放、图像旋转、图像镜像、图像仿射、图像透视等。

二、图像平移

图像平移是将图像中的所有像素点按照给定的平移量进行水平或垂直方向上的移动。假设原始像素的位置坐标为（x0，y0），经过平移量（△x，△y）后，坐标变为（x1, y1），如图所示:
在这里插入图片描述
用数学式子表示为公式，△x 和△y 称为平移量:

$\mathrm{x}_{1}=\mathrm{x}_{0}+\Delta \mathrm{x}$
$\mathrm{y}_{1}=\mathrm{y}_{0}+\Delta \mathrm{y}$

2.1 使用数学公式的实现方式为：

def translate_img(img, move_y, move_x):
    h, w, c = img.shape
    translated_img = np.zeros((h, w, c), dtype=np.uint8)
    for i in range(h):
        for j in range(w):
            if i >= move_y and j >= move_x:
                translated_img[i, j] = img[i - move_y, j - move_x]
    return translated_img

2.2 使用矩阵实现的方式为

用矩阵表示如公式所示:

$\begin{bmatrix}{x_{1}}&{y_{1}}&1\end{bmatrix} = \begin{bmatrix}{x_{0}}&{y_{0}}&1\end{bmatrix} \begin{bmatrix}{1}&{0}&{0}\\{0}&{1}&{0}\\{\Delta \mathrm{x}}&{\Delta \mathrm{y}}&{1}\end{bmatrix}$
式子中，矩阵称为平移变换矩阵或因子，△x 和△y 称为平移量。

def translate_image(image, move_x, move_y):
    # 平移矩阵
    translation_matrix = np.array([[1, 0, 0], [0, 1, 0], [move_x, move_y, 1]])
    height, width = image.shape[:2]
    translated_image = np.zeros([height, width, 3], dtype=np.uint8)
    for y in range(height):
        for x in range(width):
            translated_x, translated_y, _ = np.dot([x, y, 1], translation_matrix)
            if 0 <= translated_x < width and 0 <= translated_y < height:
                translated_image[translated_y, translated_x] = image[y, x]
    return translated_image

2.3 使用opencv

图像平移首先定义平移矩阵 M，再调用 warpAffine()函数实现平移，核心函数如下：
M = np.float32([[1, 0, x], [0, 1, y]])
M 表示平移矩阵，其中 x 表示水平平移量，y 表示垂直平移量

shifted = cv2.warpAffine(src, M, dsize[, dst[, flags[, borderMode[,
borderValue]]]])

src 表示原始图像
M 表示平移矩阵
dsize 表示变换后的输出图像的尺寸大小
dst 为输出图像，其大小为 dsize，类型与 src 相同
flag 表示插值方法的组合和可选值
borderValue 表示像素外推法，当 borderMode =BORDER_TRANSPARENT 时，表示目标图像中的像素不会修改源图像中的“异常值”。
borderValue 用于边界不变的情况，默认情况下为 0

img = cv.imread("lena.webp")
h, w, c = img.shape
translated_img = translate_image(img, h // 3, w // 3)
img_all = np.hstack((img, translated_img))
cv.imshow("img", img_all)


M = np.float32([[1, 0, 100], [0, 1, 50]])
#获取原始图像列数和行数
rows, cols = img.shape[:2]
#图像平移
result = cv.warpAffine(img, M, (cols, rows))
#显示图像
cv.imshow("original", img)
cv.imshow("result", result)
#等待显示
cv.waitKey(0)
cv.destroyAllWindows()

三、图像缩放

图像缩放（image scaling）是指对数字图像的大小进行调整的过程。

3.1 用数学式子表示为公式(a为缩放系数):

$\mathrm{x}_{1}=a*\mathrm{x}_{0}$
$\mathrm{y}_{1}=a*\mathrm{y}_{0}$

def resize_img(img, x_size, y_size):
    h, w, c = img.shape
    translated_img = np.zeros((int(x_size*h), int(y_size*w), c), dtype=np.uint8)
    for i in range(h):
        for j in range(w):
                translated_img[int(i*x_size), int(j*y_size)] = img[i, j]
    return translated_img

3.2 用矩阵表示如公式所示:

最低0.47元/天解锁文章

优雅的心情

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python图像处理-----几何变换

图像几何变换在变换过程中会建立一种原图像像素与变换后图像像素之间的映射关系，通过这种关系，能够从一方的像素计算出另一方的像素的坐标位置。通常将图像坐标映射到输出的过程称作向前映射，反之，将输出图像映射到输入的过程称作向后映射。图像平移是将图像中的所有像素点按照给定的平移量进行水平或垂直方向上的移动。绍常见的图像几何变换，包括图形平移、图像缩放、图像旋转、图像镜像、图像仿射、图像透视等。图像几何变换不改变图像的像素值，在图像平面上进行像素变换。式子中，矩阵称为平移变换矩阵或因子，△x 和△y 称为平移量。
复制链接

扫一扫