一、引言
图像错切变换属于图像的几何变换。图像错切错切变换包括水平方向错切变换和竖直方向错切变换。水平方向错切就相当于有一摞书,保持高度不变的情况下,从上层到下层,整体按照一定的比例(其实就是斜率)向左侧或者右侧移动。而竖直方向则可以看做是水平方向旋转了90°的结果而已。错切示意图如下图所示。
其数学原理很简单,就是简单的矩阵乘法。
本文给出了图像竖直方向错切变换的Python详细实现过程(纯手工)。
二、竖直方向变换数学公式
假设变换之前的坐标为(x,y),变换之后的坐标为(x*, y*),则沿水平方向错切变换变换公式的矩阵形式为:
其中系数d是错切比例。
展开之后就是:
由此可以看出水平方向的错切变换就是针对行坐标y进行变换,而列坐标x不变。
通过对比水平方向错切和竖直方向错切变换,可以发现,沿着哪个方向错切,则变换哪个坐标分量即可。
三、Python手工实现图像竖直方向错切变换
1.单通道图像竖直方向变换
#im为单通道图像像素矩阵
#delta为错切比例,delta>0表示向上错切,否则向下侧错切
#返回错切变换结果图像
def SingleChannelShearY( im, delta ):
[m, n] = np.shape( im )
h = int( m + abs( delta * n ) )#变换后图像的高度
imRT = np.zeros( [ h, n ] )#高度改变
for i in range( m ):
for j in range( n ):
if delta > 0:
imRT[i + int( delta*j )][n-j-1] = im[i][n-j-1]
else:
imRT[i + int( -delta*j )][j] = im[i][j]
imRT = imRT.clip( 0, 255 )#限制灰度值在0~255之间
imRT = np.rint(imRT).astype('uint8')#设置像素的数据类型
return imRT
2.灰度图像或彩色图像竖直方向错切变换
灰度图像直接调用前面的单通道图像变换函数即可。
彩色图像针对R、G、B分量分别调用单通道图变换函数即可。
def ImageShearTransform( im, delta ):
dims = np.shape( im )#获取图像维数
lens = len( dims ) #lens值为2则是灰度图像,为3则是彩色图像
if lens == 2:#单通道图像
imRT = SingleChannelShearY( im, delta )
if lens == 3:#三通道图像
imr = im[ :, :, 0 ]
img = im[ :, :, 1 ]
imb = im[ :, :, 2 ]
imrRT = SingleChannelShearY( imr, delta )
imgRT = SingleChannelShearY( img, delta )
imbRT = SingleChannelShearY( imb, delta )
imRT = np.stack( ( imrRT, imgRT, imbRT ), 2 )
return imRT
3.完整的图像沿竖直方向错切变换代码
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
#单通道图像的竖直方向错切变换
#im为单通道图像像素矩阵
#delta为错切比例,delta>0表示向上错切,否则向下侧错切
#返回错切变换结果图像
def SingleChannelShearY( im, delta ):
[m, n] = np.shape( im )
h = int( m + abs( delta * n ) )
imRT = np.zeros( [ h, n ] )
for i in range( m ):
for j in range( n ):
if delta > 0:
imRT[i + int( delta*j )][n-j-1] = im[i][n-j-1]
else:
imRT[i + int( -delta*j )][j] = im[i][j]
imRT = imRT.clip( 0, 255 )#限制灰度值在0~255之间
imRT = np.rint(imRT).astype('uint8')#设置像素的数据类型
return imRT
#图像竖直方向错切变换,可以是灰度图像,也可以是彩色图像
def ImageShearTransform( im, delta ):
dims = np.shape( im )#获取图像维数
lens = len( dims ) #lens值为2则是灰度图像,为3则是彩色图像
if lens == 2:#单通道图像
imRT = SingleChannelShearY( im, delta )
if lens == 3:#三通道图像
imr = im[ :, :, 0 ]
img = im[ :, :, 1 ]
imb = im[ :, :, 2 ]
imrRT = SingleChannelShearY( imr, delta )
imgRT = SingleChannelShearY( img, delta )
imbRT = SingleChannelShearY( imb, delta )
imRT = np.stack( ( imrRT, imgRT, imbRT ), 2 )
return imRT
def main():
im = np.array( Image.open('dog.jpg', 'r') )
#im = np.array( Image.open('lena.bmp', 'r') )
#print( 'size:',im.shape )
plt.figure()
plt.imshow( im, cmap = 'gray' )
plt.axis( 'off' )
delta = -0.5#向下侧错切
imRT = ImageShearTransform( im, delta )
#print( imRT.shape )
plt.figure()
plt.imshow( imRT, cmap = 'gray' )
plt.axis( 'off' )
delta = 0.5#向上侧错切
imRT = ImageShearTransform( im, delta )
#print( imRT.shape )
plt.figure()
plt.imshow( imRT, cmap = 'gray' )
plt.axis( 'off' )
if __name__ == '__main__':
main()
运行结果: