线性代数应用系列-1-图像旋转(1/N)-最基础直接的方式

本文链接：https://blog.csdn.net/yuezhilanyi/article/details/117423755

本文通过实例解析了如何使用线性代数对二维平面点进行逆时针旋转，涉及齐次坐标和图像边界计算。作者详细展示了如何处理Lena图旋转后的边界调整，并讨论了图像旋转过程中可能出现的问题，如黑色条码的出现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

图像旋转1/N-最基础直接的方式

最近考虑到个人发展的事情，打算巩固下图像处理相关方面的基础，于是开始重温一本关于线性代数及其应用的书《Linear Algebra with Applications, 9th edition》。

使用经典的Lena图（512x512尺寸），请自行搜索获取。
在这里插入图片描述

线性代数与点旋转

直接说结论，对于二维平面上的一个点来说，将其逆时针旋转 $\theta$ 即表示其对应的旋转矩阵为
$\left[ \begin{matrix} cos(\theta) & -sin(\theta)\\ sin(\theta) & cos(\theta) \end{matrix} \right]$
实际应用中，取得是其齐次坐标的形式，即
$\left[ \begin{matrix} cos(\theta) & -sin(\theta) & 0\\ sin(\theta) & cos(\theta) & 0\\ 0 & 0 & 1 \end{matrix} \right]$

以将点 [1,1], [2, 2] 分别逆时针旋转45°为例，
$\theta=45 / 180 * np.pi$
旋转矩阵为
$rotation\_matrix = \left[ \begin{matrix} 0.7071 & -0.7071 & 0\\ 0.7071 & 0.7071 & 0\\ 0 & 0 & 1 \end{matrix} \right]$
进行矩阵乘法

rotated_points = rotation_matrix @ np.array([[1, 1, 1], [2, 2, 1]]).T

结果为
$rotation\_matrix = \left[ \begin{matrix} 0. & 0.\\ 1.4142 & 2.8284\\ 1 & 1 \end{matrix} \right]$
即[1, 1]旋转后的坐标为[0., 1.4142]，[2, 2]旋转后的坐标为[0, 2.8284]。

图像边界的确定

设图像宽高像素分别为w，h，则旋转后的图像边界坐标点为

new_boundary = np.dot(rotation_matrix, np.array([[0, 0, 1], [0, w, 1], [h, w, 1], [h, 0, 1]]).T).T

计算得出结果为

array([[   0.        ,    0.        ,    1.        ],
        [-362.03867197,  362.03867197,    1.        ],
        [   0.        ,  724.07734394,    1.        ],
        [ 362.03867197,  362.03867197,    1.        ]]

下面开始计算图像的新边界。因为图像的横纵坐标只支持正整数，所以需要对图像整体做一个偏移

min_x, max_x = new_boundary[:, 0].min(), new_boundary[:, 0].max()
min_y, max_y = new_boundary[:, 1].min(), new_boundary[:, 1].max()
new_h = int(max_y - min_y) + 1  # 725
new_w = int(max_x - min_x) + 1  # 725

即对所有图像中的点，都需要减去下面这个偏移量，转化为正坐标

min_value = int(round(new_boundary[:, 0].min())), int(round(new_boundary[:, 1].min()))  # (-362, 0)

由上述计算可知，新图像是一个725x725的矩阵。

图像的旋转

本文使用最基础直接的方式对图像旋转，即用一个二重循环，对图像上的每一个点，经由矩阵乘法获取其新坐标，并将原图的像素值复制过去。

# 构建一个空数组，用于放置旋转后的图像
rotated_img = np.empty((new_h + 0, new_w + 0, 3), dtype='uint8')
# 迭代每一行
for i in range(h):
	# 迭代每一列
    for j in range(w):
    	# 计算新坐标：矩阵乘之后，减去偏移量
        new_coord = np.dot(rotation_matrix, [i, j, 1]).astype(np.int16)[:2] - min_value
        # 赋值
        # 这里注意要用`tuple(new_coord)`而不是数组或者列表，否则是对选定得两行赋值
        rotated_img[tuple(new_coord)] = img_arr[i, j]