【数字图像处理】2.几何变换

码字神经元

已于 2023-06-17 13:53:53 修改

阅读量1.7k

点赞数 1

文章标签：计算机视觉图像处理 opencv

于 2023-06-16 11:33:55 首次发布

本文链接：https://blog.csdn.net/qq_59572329/article/details/131243456

版权

几何变换：放大、缩小、旋转等，改变空间位置。

完成几何变换需要两个独立的算法：1.实现空间坐标转换(像素如何从初始位置移动到终止位置)，2.插值算法(完成输出图像每个像素值的灰度值）

什么是几何变换？

将一组图像数据经过某种数学运算，映射成另外一组图像数据的操作，主要包括放大、缩小、旋转等。

为什么要对图像进行几何变换？

几何变换可以在一定程度上的消除图像由于角度、透视关系、拍摄等原因造成的几何失真。几何变换处理是深度学习中数据增强的一种常用手段，是进行图像识别前的数据预处理工作内容。比如，在车牌识别过程中，并不能保证被检测的物体在图像的相同位置和方向，所以我们首先要解决的就是被检测物体的位置和方向。

2.1 仿射变换（二维）

平移、放大和缩小、旋转、插值算法。

像素的三维矩阵：宽度，高度和颜色通道

缩放：OpenCV提供了resize()函数来实现这种目的。使用resize()函数需要注意两点：(1)指定的目标大小必须为整数；(2)指定目标大小列数在前，行数在后，与numpy.array的shape属性相反。

#!/user/bin/env python3
# -*- coding: utf-8 -*-
"""
几何变换：放大、缩小、旋转等，改变空间位置
完成几何变换需要两个独立的算法：
1.实现空间坐标转换(像素如何从初始位置移动到终止位置)，
2.插值算法(完成输出图像每个像素值的灰度值）
"""
import cv2
import numpy as np
import sys
import math

# 仿射变换（二维）
image = cv2.imread('../Img/7418.jpeg')
h,w = image.shape[:2]
# 缩小两倍
A1 = np.array([[0.5,0,0],[0,0.5,0]],np.float32)
d1 = cv2.warpAffine(image,A1,(w,h),borderValue = 125)

# 先缩小两倍，再平移
A2 = np.array([[0.5,0,w/4],[0,0.5,100]],np.float32)
d2 = cv2.warpAffine(image,A2,(w,h),borderValue = 125)

# 在d2的基础上，绕图像的中心点旋转
A3 = cv2.getRotationMatrix2D((w/2.0,h/2.0),90,0.5)
d3 = cv2.warpAffine(d2,A3,(w,h),borderValue=125)


cv2.imshow('image',image)
cv2.imshow('d1',d1)
cv2.imshow('d2',d2)
cv2.imshow('d3',d3)
cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.warpAffine(src, M, dsize[, dst[, flags[, borderMode[, borderValue]]]])

warpAffine(原图，变换矩阵，输出图像尺寸，输出图像=None，插值方法=None，边界像素模式=None，边界填充值=None）

①flages表示插值方式，默认为 flags=cv2.INTER_LINEAR，表示线性插值，此外还有：cv2.INTER_NEAREST（最近邻插值） cv2.INTER_AREA （区域插值） cv2.INTER_CUBIC（三次样条插值） cv2.INTER_LANCZOS4（Lanczos插值）

②borderMode默认值为 cv2.BORDER_CONSTANT，指定边界模式（例如：cv2.BORDER_REPLICATE 表示复制边界，cv2.BORDER_WRAP 表示环绕边界，cv2.BORDER_REFLECT 表示反射边界，cv2.BORDER_REFLECT_101 表示边界反射，等等）

③borderValue，默认为黑色(0, 0, 0)，是 borderMode 中边界像素的值。

cv2.getRotationMatrix2D(center, angle, scale)：旋转中心、旋转角度、尺度因子

np.float16、np.float32、np.float64 分别代表 Numpy 库中的三种不同的浮点数类型，分别对应着半精度浮点数、单精度浮点数和双精度浮点数。它们之间的区别主要有以下几个方面：

①精度：半精度浮点数只能表示小数点后 3 位的数字，单精度浮点数能表示小数点后 7 位的数字，而双精度浮点数能表示小数点后 15 位的数字。因此，半精度浮点数的精度最低，而双精度浮点数的精度最高。

②内存占用：半精度浮点数只占用 2 个字节的内存空间，单精度浮点数占用 4 个字节，而双精度浮点数占用 8 个字节。因此，半精度浮点数占用的内存最少，而双精度浮点数占用的内存最多。

③运算速度：由于半精度浮点数占用的内存最少，因此在计算时速度最快。而双精度浮点数占用的内存最多，在计算时速度最慢。

2.2 投影变换（三维）

投影变换也称透视变换。

#!/user/bin/env python3
# -*- coding: utf-8 -*-
"""
投影变换(三维）：
"""
import cv2
import numpy as np
import math
image = cv2.imread('../Img/7418.jpeg')
h,w = image.shape[:2]
print(h)
print(w)
# 原图的4个点，与投影变换的4个点
src = np.array([[0,0],[w-1,0],[0,h-1],[w-1,h-1]],np.float32)
dst = np.array([[550,50],[600,50],[0,500],[w-1,500]],np.float32)

# 计算投影变换矩阵
p = cv2.getPerspectiveTransform(src,dst)

# 利用计算出的投影变换矩阵进行头像的投影变换
r = cv2.warpPerspective(image,p,(w,h),borderValue=125)
cv2.imshow('image',image)
cv2.imshow('warpPerspective',r)
cv2.waitKey(0)
cv2.destroyAllWindows()

2.3 极坐标变换

笛卡尔坐标和极坐标是两种不同的描述平面上点位置的方式。

笛卡尔坐标系是平面直角坐标系，用两个垂直的轴（通常是x轴和y轴）来描述平面上任意一点的位置。每个点的坐标用一个有序的数对 (x,y) 来表示，其中第一个数表示点在x轴上的距离，第二个数表示点在y轴上的距离。

极坐标系则是将平面上的点描述为一个距离和一个角度的组合。用极坐标系描述点的方式是将点与原点的连线看作是一个半径，而这个半径与x轴的夹角（通常用弧度表示）就是点的极角。点的坐标用一个有序的数对 (r,θ) 来表示，其中r表示点到原点的距离，θ表示点与x轴的夹角。

极坐标变换：通常用来校正图像中圆形物体或者被包含在圆环中的物体

2.3.1 将笛卡尔坐标转化为极坐标

cv2.cartToPolar(x, y, magnitude=None, angle=None, angleInDegrees=None)

# 1.将笛卡尔坐标转化为极坐标

# 举例：(11,13)以(3,5)为中心进行极坐标变换：
r = math.sqrt(math.pow(11-3,2)+math.pow(13-5,2))
theta = math.atan2(13-5,11-3)/math.pi*180
print(r, "\n", theta)

# 举例：计算（0,0）（1,0）（2,0）（0,1）（1,1）（2,1）（0,2）（1,2）（2,2）这9个点以（1,1）为中心进行的极坐标变换。
x = np.array([[0,1,2],[0,1,2],[0,1,2]],np.float64)-1
y = np.array([[0,0,0],[1,1,1],[2,2,2]],np.float64)-1
r, theta = cv2.cartToPolar(x,y,angleInDegrees=True)
print(r, "\n", theta)

2.3.2 将极坐标转换为笛卡尔坐标

# 2.将极坐标转换为笛卡尔坐标

# 举例：已知极坐标（角度，半径）中的（30,10）、（31,10）、（30,11）、（31,11）.
# 求笛卡尔坐标中哪四个坐标以（-12,15）为中心经过极坐标变换后得到这四个坐标
angle = np.array([[30,31],[30,31]],np.float32)
r = np.array([[10,10],[11,11]],np.float32)
x,y = cv2.polarToCart(r,angle,angleInDegrees=True)
x = x-12
y = y+15
print(x, "\n", y)

2.3.3 利用极坐标变换对图像进行变换

def polar(I,center,r,theta=(0,360),rstep=1.0,thetastep=360.0/(180*8)):

线性极坐标变换linearPolar

dst = cv2.linearPolar(src,(550,550),550,cv2.INTER_LINEAR) # 变换中心，变换的最大距离

对数极坐标函数logPolar

dst = cv2.logPolar(src,(550,550),150,cv2.INTER_LINEAR) # 变换中心，系数（大一点）

cv2.logPolar（原图，变换中心，要变换的边界圆的半径，插值方法）

# 3.利用极坐标变换对图像进行变换

a = np.array([[1,2],[3,4]])
b = np.tile(a,(2,3)) # 将a分别在垂直方向和水平方向上复制2次和3次
print(b)

# 参数分别为：输入图像、极坐标变换中心、二元元组(代表最大距离和最小距离）、rstep=r的变换步长，
# thetastep=角度的变换步长，默认为1/4,

def polar(I,center,r,theta=(0,360),rstep=1.0,thetastep=360.0/(180*8)):
    # 获取极坐标变换中心坐标
    cx, cy = center

    # 得到距离最小、最大范围
    minr, maxr = r

    # 角度的范围
    mintheta,maxtheta = theta

    # 输出图像的宽、高
    H = int((maxr-minr)/rstep)+1
    W = int((maxtheta-mintheta)/thetastep)+1
    O = 125*np.ones((H,W),I.dtype)
    print(O)
    # 极坐标变换
    r = np.linspace(minr,maxr,H)
    r = np.tile(r,(W,1))
    r = np.transpose(r)
    theta = np.linspace(mintheta,maxtheta,W)
    theta = np.tile(theta,(H,1))
    x,y = cv2.polarToCart(r,theta,angleInDegrees=True)

    # 最近邻插值
    for i in range(H):
        for j in range(W):
            px = int(round(x[i][j])+cx)
            py = int(round(y[i][j])+cy)
            if((px>=0 and px<=w-1) and (py>=0 and py<=h-1)):
                O[i][j] = I[py][px]

    return O



I = cv2.imread("../Img/1685776846611.jpg")
i = cv2.cvtColor(I,cv2.COLOR_BGR2GRAY)
h,w = I.shape[:2]
# 极坐标变换中心
cx, cy = 550,550  # 圆形
cv2.circle(I,(int(cx),int(cy)),10,(255.0,0,0),3)
#j
O = polar(i,(cx,cy),(0,550))  # 范围
O = cv2.flip(O,0)
# cv2.imshow('I',I)
# cv2.imshow('O',O)
# cv2.waitKey(0)
# cv2.destroyAllWindows()

# 3.1 线性极坐标变换linearPolar
import cv2

src = cv2.imread('../Img/1685776846611.jpg')
# cv2.imshow("src",src)
dst = cv2.linearPolar(src,(550,550),550,cv2.INTER_LINEAR) # 变换中心，变换的最大距离
# cv2.imshow('dst',dst)
# cv2.waitKey(0)
# cv2.destroyAllWindows()

# 3.2 对数极坐标函数logPolar
import cv2

src = cv2.imread('../Img/1685776846611.jpg')
cv2.imshow("src",src)
dst = cv2.logPolar(src,(550,550),150,cv2.INTER_LINEAR) # 变换中心，系数（大一点）
cv2.imshow('dst',dst)
cv2.waitKey(0)
cv2.destroyAllWindows()