【OpenCv】图像的相关变换

最新推荐文章于 2023-06-09 10:45:23 发布

小白哒哒

最新推荐文章于 2023-06-09 10:45:23 发布

阅读量760

点赞数

文章标签： opencv 计算机视觉 python

本文链接：https://blog.csdn.net/m0_61796189/article/details/127183872

版权

图像平移

图像平移的本质是一个线性变换。如果图像在y轴平移 $d_y$ 个单位，在x轴平移 $d_x$ 个单位，则有
$\begin{bmatrix}x \\y\\1\end{bmatrix} = \begin{bmatrix} 1 &0 & d_x \\ 0 & 1 & d_y \\ 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} x_0 \\ y_0 \\ 1 \end{bmatrix}$
即平移后点的坐标为：
$x=x_0+d_x ，y=y_0+d_y$
如果 $d_x$ 小于0则表示向左平移， $d_y$ 大于0则表示向上平移。构建完平移矩阵后由放射变换函数cv2.warpAffine 计算变换后的平移图像。

 cv2.warpAffine(src, M, dsize，flags，borderMode, borderValue)

参数说明
src：输入图像
M：仿射变换矩阵（2行3列）
dsize：输出图像的大小 (width, height)
flags：插值方法的组合，默认线性插值cv2.INTER_LINEAR 还有

cv2.INTER_NEAREST（最近邻插值）
cv2.INTER_AREA （区域插值）
cv2.INTER_CUBIC（三次样条插值）
cv2.INTER_LANCZOS4（Lanczos插值）

borderMode：边界像素模式
borderValue：边界填充值; 默认情况下为黑色填充

import cv2
import numpy as np
img = cv2.imread('rose.png')
H = np.float32([[1, 0, 50], [0, 1, 20]]) #变换矩阵：设置平移变换所需的计算矩阵：2行3列
#[[1,0,50],[0,1,20]]   表示平移变换：其中50表示水平方向上的平移距离，20表示竖直方向上的平移距离。

rows, cols = img.shape[:2]
res = cv2.warpAffine(img, H, (cols, rows),borderValue=(255,255,255))  
cv2.imshow('origin_picture', img)
cv2.imshow('translation', res)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

图像缩放

图像缩放是指图像大小按照指定的比例或者按照指定的缩放图像大小进行放大或者缩小。

cv2.resize(src,dsize=None,fx,fy,interpolation)

参数说明：
src：原图像
dsize：缩放后的图像大小，比例因子二选一
fx,fy：x 和 y 方向上的缩放比例
interpolation：插值方法

常见的插值方法
• 默认为 flags=cv2.INTER_NEAREST（最近邻插值）
• cv2.INTER_LINEAR，双线性插值
• cv2.INTER_CUBIC 三次样条插值 4x4像素邻域
• cv2.INTER_LANCZOS4 Lanczos插值，8x8像素邻域
• cv2.INTER_AREA 区域插值
官网中说要缩小图片，通常最好的插值方法是 cv.INTER_AREA；要放大一张图片，通常最好的是 cv.INTER_CUBIC （速度慢）或者 cv.INTER_LINEAR （速度快一些但结果仍然不错）。
接下来简单的介绍最近邻插值和双线性插值。

双线性插值

双线性插值实际上是从2个方向一共进行了3次单线性插值
我们先了解一下单线性插值，请看下图：
在这里插入图片描述
两点确定一条直线有：
$y-y_0)/(x-x_0)=(y_1-y_0)/(x_1-x_0)$
整理得

如果把y看成灰度值则上面可以写成：

其实右边f前面两个式子可以看成权重，当P点靠近哪一点那么那个权重就占比大，接下来看下图根据上面公式求p点坐标

1.在x方向进行单线性插值有：
在这里插入图片描述
2.在y方向进行单线性插值有：

import cv2
import numpy as np

img = cv2.imread('girl.png')
# 方法一：通过设置缩放比例
res1 = cv2.resize(img, None, fx=3, fy=3, 
                  interpolation=cv2.INTER_CUBIC)
height, width = img.shape[:2]
# 方法二：直接设置图像的大小
#cv2.INTER_NEAREST（最近邻插值） cv2.INTER_AREA （区域插值） cv2.INTER_CUBIC（三次样条插值） cv2.INTER_LANCZOS4（Lanczos插值）
res2 = cv2.resize(img, (int(0.6*width), int(0.6*height)),interpolation=cv2.INTER_LANCZOS4)

cv2.imshow('origin', img)
cv2.imshow('res2', res2)#可以输入res1对比
cv2.waitKey(0)
cv2.destroyAllWindows()

运行结果：
在这里插入图片描述

图像旋转

图像旋转是以图像中心作为原点旋转一定得角度，需要注意的圆心坐标的变换。
设点 $P_{0}(x_{0},y_{0})$ 逆时针旋转 $\theta$ 角后的对应点为 $P (x, y)$ ，根据极坐标公式旋转后坐标为：
在这里插入图片描述
对应的矩阵如下：
$\begin{bmatrix}x \\y\\1\end{bmatrix} =\begin{bmatrix} cos\theta &-sin\theta & 0 \\ sin\theta & cos\theta & 0 \\ 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} x_0 \\ y_0 \\ 1 \end{bmatrix}$

cv2.getRotationMatrix2D(center, angle, scale)

参数说明：
center：图片的旋转中心
angle：旋转角度
scale：缩放比例，正逆时针，负为顺时针

import cv2
img=cv2.imread('girl.png')
rows,cols=img.shape[:2]
M=cv2.getRotationMatrix2D((cols/2,rows/2),45,1)#旋转矩阵
dst=cv2.warpAffine(img,M,(cols,rows),borderValue=(0,255,255))

cv2.imshow('img', img)
cv2.imshow('img1',dst)
cv2.waitKey(0)
cv2.destroyAllWindows()

运行结果：
在这里插入图片描述

放射变换

放射变换是旋转、平移、伸缩等一系列的操作。原来的直线仿射变换后还是直线，直线比例保持不变，原来的平行线经过仿射变换之后还是平行线。

在几何上，一个向量空间进行一次线性变换并接上一个平移，变换为另一个向量空间。通常图像的旋转加上拉升就是图像仿射变换，仿射变换需要一个M矩阵实现，但是由于仿射变换比较复杂，很难找到这个M矩阵。
OpenCV提供了根据变换前后三个点的对应关系来自动求解M的函数

M = cv2.getAffineTransform(pos1,pos2)

参数说明：
pos1 :表示变换前的位置
pos2 :表示变换后的位置

import cv2
import numpy as np

img = cv2.imread('girl.png')
rows, cols = img.shape[:2]
#设置图像仿射变换矩阵
pos1 = np.float32([[50,50], [200,50], [50,200]])
pos2 = np.float32([[10,100], [200,50], [100,250]])
M = cv2.getAffineTransform(pos1, pos2)

#图像仿射变换
result = cv2.warpAffine(img, M, (2*cols, 2*rows))
#显示图像
cv2.imshow("original", img)
cv2.imshow("result", result)
#等待显示
cv2.waitKey(0)
cv2.destroyAllWindows()

运行结果：
在这里插入图片描述

透视变换

透视变换是将图像从一个视平面投影到另外一个视平面的过程，透视变换的变换矩阵是一个3x3的矩阵。透视变换的作用域是一个三维坐标系, 而仿射变换则是二维平面变换。仿射变换也可以看做是一种z轴方向不变的透视变换。

M = cv2.getPerspectiveTransform(pos1, pos2)

参数说明：
pos1 ：表示透视变换前的4个点对应位置
pos2 ：表示透视变换后的4个点对应位置
得到透视变换矩阵后可以使用下面函数进行透视变换

cv2.warpPerspective(src,M,(cols,rows))

import cv2
import numpy as np
import matplotlib.pyplot as plt
#读取图片
src = cv2.imread('girl.png')
#获取图像大小
rows, cols = src.shape[:2]
#设置图像透视变换矩阵
pos1 = np.float32([[114, 82], [287, 156],
                   [8, 100], [143, 177]])
pos2 = np.float32([[0, 0], [188, 0], 
                   [0, 262], [188, 262]])
M = cv2.getPerspectiveTransform(pos1, pos2)
#图像透视变换
result = cv2.warpPerspective(src, M, (2*cols,2*rows))
#显示图像
cv2.imshow("original", src)
cv2.imshow("result", result)
#等待显示
cv2.waitKey(0)
cv2.destroyAllWindows()