【数字图像处理】2.几何变换

目录

什么是几何变换?

为什么要对图像进行几何变换?

2.1 仿射变换(二维)

2.2 投影变换(三维)

2.3 极坐标变换

2.3.1 将笛卡尔坐标转化为极坐标

2.3.2 将极坐标转换为笛卡尔坐标

2.3.3 利用极坐标变换对图像进行变换


几何变换:放大、缩小、旋转等,改变空间位置。

完成几何变换需要两个独立的算法:1.实现空间坐标转换(像素如何从初始位置移动到终止位置),2.插值算法(完成输出图像每个像素值的灰度值)

什么是几何变换?

将一组图像数据经过某种数学运算,映射成另外一组图像数据的操作,主要包括放大、缩小、旋转等。

为什么要对图像进行几何变换?

几何变换可以在一定程度上的消除图像由于角度、透视关系、拍摄等原因造成的几何失真。几何变换处理是深度学习中数据增强的一种常用手段,是进行图像识别前的数据预处理工作内容。比如,在车牌识别过程中,并不能保证被检测的物体在图像的相同位置和方向,所以我们首先要解决的就是被检测物体的位置和方向。

2.1 仿射变换(二维)

平移、放大和缩小、旋转、插值算法。

像素的三维矩阵:宽度,高度和颜色通道

缩放:OpenCV提供了resize()函数来实现这种目的。使用resize()函数需要注意两点:(1)指定的目标大小必须为整数;(2)指定目标大小列数在前,行数在后,与numpy.array的shape属性相反。

#!/user/bin/env python3
# -*- coding: utf-8 -*-
"""
几何变换:放大、缩小、旋转等,改变空间位置
完成几何变换需要两个独立的算法:
1.实现空间坐标转换(像素如何从初始位置移动到终止位置),
2.插值算法(完成输出图像每个像素值的灰度值)
"""
import cv2
import numpy as np
import sys
import math

# 仿射变换(二维)
image = cv2.imread('../Img/7418.jpeg')
h,w = image.shape[:2]
# 缩小两倍
A1 = np.array([[0.5,0,0],[0,0.5,0]],np.float32)
d1 = cv2.warpAffine(image,A1,(w,h),borderValue = 125)

# 先缩小两倍,再平移
A2 = np.array([[0.5,0,w/4],[0,0.5,100]],np.float32)
d2 = cv2.warpAffine(image,A2,(w,h),borderValue = 125)

# 在d2的基础上,绕图像的中心点旋转
A3 = cv2.getRotationMatrix2D((w/2.0,h/2.0),90,0.5)
d3 = cv2.warpAffine(d2,A3,(w,h),borderValue=125)


cv2.imshow('image',image)
cv2.imshow('d1',d1)
cv2.imshow('d2',d2)
cv2.imshow('d3',d3)
cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.warpAffine(src, M, dsize[, dst[, flags[, borderMode[, borderValue]]]])

warpAffine(原图,变换矩阵,输出图像尺寸,输出图像=None,插值方法=None,边界像素模式=None,边界填充值=None)

flages表示插值方式,默认为 flags=cv2.INTER_LINEAR,表示线性插值,此外还有:cv2.INTER_NEAREST(最近邻插值) cv2.INTER_AREA (区域插值) cv2.INTER_CUBIC(三次样条插值) cv2.INTER_LANCZOS4(Lanczos插值)

borderMode默认值为 cv2.BORDER_CONSTANT,指定边界模式(例如:cv2.BORDER_REPLICATE 表示复制边界,cv2.BORDER_WRAP 表示环绕边界,cv2.BORDER_REFLECT 表示反射边界,cv2.BORDER_REFLECT_101 表示边界反射,等等)

borderValue,默认为 黑色(0, 0, 0),是 borderMode 中边界像素的值。

cv2.getRotationMatrix2D(center, angle, scale)旋转中心、旋转角度、尺度因子

np.float16、np.float32、np.float64 分别代表 Numpy 库中的三种不同的浮点数类型,分别对应着半精度浮点数、单精度浮点数和双精度浮点数。它们之间的区别主要有以下几个方面:

①精度:半精度浮点数只能表示小数点后 3 位的数字,单精度浮点数能表示小数点后 7 位的数字,而双精度浮点数能表示小数点后 15 位的数字。因此,半精度浮点数的精度最低,而双精度浮点数的精度最高。

②内存占用:半精度浮点数只占用 2 个字节的内存空间,单精度浮点数占用 4 个字节,而双精度浮点数占用 8 个字节。因此,半精度浮点数占用的内存最少,而双精度浮点数占用的内存最多。

③运算速度:由于半精度浮点数占用的内存最少,因此在计算时速度最快。而双精度浮点数占用的内存最多,在计算时速度最慢。

2.2 投影变换(三维)

投影变换也称透视变换。

#!/user/bin/env python3
# -*- coding: utf-8 -*-
"""
投影变换(三维):
"""
import cv2
import numpy as np
import math
image = cv2.imread('../Img/7418.jpeg')
h,w = image.shape[:2]
print(h)
print(w)
# 原图的4个点,与投影变换的4个点
src = np.array([[0,0],[w-1,0],[0,h-1],[w-1,h-1]],np.float32)
dst = np.array([[550,50],[600,50],[0,500],[w-1,500]],np.float32)

# 计算投影变换矩阵
p = cv2.getPerspectiveTransform(src,dst)

# 利用计算出的投影变换矩阵进行头像的投影变换
r = cv2.warpPerspective(image,p,(w,h),borderValue=125)
cv2.imshow('image',image)
cv2.imshow('warpPerspective',r)
cv2.waitKey(0)
cv2.destroyAllWindows()

2.3 极坐标变换

笛卡尔坐标和极坐标是两种不同的描述平面上点位置的方式。

笛卡尔坐标系是平面直角坐标系,用两个垂直的轴(通常是x轴和y轴)来描述平面上任意一点的位置。每个点的坐标用一个有序的数对 (x,y) 来表示,其中第一个数表示点在x轴上的距离,第二个数表示点在y轴上的距离。

极坐标系则是将平面上的点描述为一个距离和一个角度的组合。用极坐标系描述点的方式是将点与原点的连线看作是一个半径,而这个半径与x轴的夹角(通常用弧度表示)就是点的极角。点的坐标用一个有序的数对 (r,θ) 来表示,其中r表示点到原点的距离,θ表示点与x轴的夹角。

极坐标变换:通常用来校正图像中圆形物体或者被包含在圆环中的物体

2.3.1 将笛卡尔坐标转化为极坐标

cv2.cartToPolar(x, y, magnitude=None, angle=None, angleInDegrees=None)

# 1.将笛卡尔坐标转化为极坐标

# 举例:(11,13)以(3,5)为中心进行极坐标变换:
r = math.sqrt(math.pow(11-3,2)+math.pow(13-5,2))
theta = math.atan2(13-5,11-3)/math.pi*180
print(r, "\n", theta)

# 举例:计算(0,0)(1,0)(2,0)(0,1)(1,1)(2,1)(0,2)(1,2)(2,2)这9个点以(1,1)为中心进行的极坐标变换。
x = np.array([[0,1,2],[0,1,2],[0,1,2]],np.float64)-1
y = np.array([[0,0,0],[1,1,1],[2,2,2]],np.float64)-1
r, theta = cv2.cartToPolar(x,y,angleInDegrees=True)
print(r, "\n", theta)

2.3.2 将极坐标转换为笛卡尔坐标

# 2.将极坐标转换为笛卡尔坐标

# 举例:已知极坐标(角度,半径)中的(30,10)、(31,10)、(30,11)、(31,11).
# 求笛卡尔坐标中哪四个坐标以(-12,15)为中心经过极坐标变换后得到这四个坐标
angle = np.array([[30,31],[30,31]],np.float32)
r = np.array([[10,10],[11,11]],np.float32)
x,y = cv2.polarToCart(r,angle,angleInDegrees=True)
x = x-12
y = y+15
print(x, "\n", y)

2.3.3 利用极坐标变换对图像进行变换

def polar(I,center,r,theta=(0,360),rstep=1.0,thetastep=360.0/(180*8)):

  1. 线性极坐标变换linearPolar

dst = cv2.linearPolar(src,(550,550),550,cv2.INTER_LINEAR) # 变换中心,变换的最大距离

  1. 对数极坐标函数logPolar

dst = cv2.logPolar(src,(550,550),150,cv2.INTER_LINEAR) # 变换中心,系数(大一点)

cv2.logPolar(原图,变换中心,要变换的边界圆的半径,插值方法)

# 3.利用极坐标变换对图像进行变换

a = np.array([[1,2],[3,4]])
b = np.tile(a,(2,3)) # 将a分别在垂直方向和水平方向上复制2次和3次
print(b)

# 参数分别为:输入图像、极坐标变换中心、二元元组(代表最大距离和最小距离)、rstep=r的变换步长,
# thetastep=角度的变换步长,默认为1/4,

def polar(I,center,r,theta=(0,360),rstep=1.0,thetastep=360.0/(180*8)):
    # 获取极坐标变换中心坐标
    cx, cy = center

    # 得到距离最小、最大范围
    minr, maxr = r

    # 角度的范围
    mintheta,maxtheta = theta

    # 输出图像的宽、高
    H = int((maxr-minr)/rstep)+1
    W = int((maxtheta-mintheta)/thetastep)+1
    O = 125*np.ones((H,W),I.dtype)
    print(O)
    # 极坐标变换
    r = np.linspace(minr,maxr,H)
    r = np.tile(r,(W,1))
    r = np.transpose(r)
    theta = np.linspace(mintheta,maxtheta,W)
    theta = np.tile(theta,(H,1))
    x,y = cv2.polarToCart(r,theta,angleInDegrees=True)

    # 最近邻插值
    for i in range(H):
        for j in range(W):
            px = int(round(x[i][j])+cx)
            py = int(round(y[i][j])+cy)
            if((px>=0 and px<=w-1) and (py>=0 and py<=h-1)):
                O[i][j] = I[py][px]

    return O



I = cv2.imread("../Img/1685776846611.jpg")
i = cv2.cvtColor(I,cv2.COLOR_BGR2GRAY)
h,w = I.shape[:2]
# 极坐标变换中心
cx, cy = 550,550  # 圆形
cv2.circle(I,(int(cx),int(cy)),10,(255.0,0,0),3)
#j
O = polar(i,(cx,cy),(0,550))  # 范围
O = cv2.flip(O,0)
# cv2.imshow('I',I)
# cv2.imshow('O',O)
# cv2.waitKey(0)
# cv2.destroyAllWindows()

# 3.1 线性极坐标变换linearPolar
import cv2

src = cv2.imread('../Img/1685776846611.jpg')
# cv2.imshow("src",src)
dst = cv2.linearPolar(src,(550,550),550,cv2.INTER_LINEAR) # 变换中心,变换的最大距离
# cv2.imshow('dst',dst)
# cv2.waitKey(0)
# cv2.destroyAllWindows()

# 3.2 对数极坐标函数logPolar
import cv2

src = cv2.imread('../Img/1685776846611.jpg')
cv2.imshow("src",src)
dst = cv2.logPolar(src,(550,550),150,cv2.INTER_LINEAR) # 变换中心,系数(大一点)
cv2.imshow('dst',dst)
cv2.waitKey(0)
cv2.destroyAllWindows()

 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

码字神经元

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值