利用 python 实现多张图片的无损拼接
以下两段是作者的心路历程,图个乐的可以看一看,想学干货可以直接略过。
就在昨天晚上,我要为文章配图,要求是将6张图拼接为3张图。我就想,可以呀,PS应该很容易搞定,虽然我PS功底差,但架不住我有位朋友是 king of PS 呀(朋友间的调侃啦)。所以我将每张图都剪切成一样的高度,希望能对PS的过程有所帮助。
好朋友不愧是 king of PS ,每张图都拼接的很棒。但是,三张图一一对比,细看还是有一些不太对齐,身患强迫症的我当然心中有些疙瘩。不过好朋友已经做的很棒了,我不能以自己的强迫症去强迫别人,所以我就走上了“自主研发”的道路。
往期博客:
导入 python 库
import matplotlib.pyplot as plt
import skimage.io as io
import numpy as np
查看需要拼接的图片
因为工作需要,所以就不使用昨天晚上的图片了。
我就拿了两张截图作为示例演示。
首先看看拼接前的图片是什么样子:
jzg = io.imread('jzg.jpg') # np.ndarray, [h, w, c], 值域[0, 255], RGB
plt.imshow(jzg) #查看图片
plt.show()
解释说明:“jzg”保存的是numpy的数组。
lgz = io.imread('lgz.jpg') # np.ndarray, [h, w, c], 值域[0, 255], RGB
plt.imshow(lgz)
plt.show()
因为我使用的是 jupyter Notebook,所以图片显示的不是太清晰。
查看一下图片的大小和数组元素的数据类型。
print(jzg.shape) #查看图片的大小
print(jzg.dtype) #查看数组元素数据类型
print(lgz.shape)
print(lgz.dtype)
输出:
(720, 1280, 3)
uint8
(720, 1280, 3)
uint8
(720, 1280, 3)表示的是数组的大小,物理意义为[h, w, c],分别是图片的高度h,图片的宽度w,图片的通道数c。
可以看出两者的大小完全一致,数组元素的数据类型为“uint8”。
查看数组中元素的值域:
print([jzg.min(), jzg.max()])
输出:
[0, 255]
横向拼接
创建拼接用的数组:
pj1 = np.zeros((720,1280 + 1280,3)) #横着拼接
pj1[:,:1280,:] = jzg.copy() #图片jzg在左
pj1[:,1280:,:] = lgz.copy() #图片lgz在右
print(pj1.dtype) #查看数组元素类型
输出:
float64
可以看出拼接后的数据类型不一样了,所以要改一下,不然显示的就是错误的。
pj1=np.array(pj1,dtype=np.uint8) #将pj1数组元素数据类型的改为"uint8"
plt.imshow(pj1) #查看拼接情况
plt.show()
保存拼接后的图片
将拼接后的图片保存在当前目录下,也可以改为其它的路径。
io.imsave('pj1.jpg', pj1) #保存拼接后的图片
总结
横向拼接的代码总结如下:
import matplotlib.pyplot as plt
import skimage.io as io
import numpy as np
jzg = io.imread('jzg.jpg') # np.ndarray, [h, w, c], 值域(0, 255), RGB
plt.imshow(jzg) #查看图片
plt.show()
lgz = io.imread('lgz.jpg') # np.ndarray, [h, w, c], 值域(0, 255), RGB
plt.imshow(lgz)
plt.show()
print(jzg.shape) #查看图片的大小
print(jzg.dtype) #查看数组元素数据类型
print(lgz.shape)
print(lgz.dtype)
pj1 = np.zeros((720,1280 + 1280,3)) #横向拼接
pj1[:,:1280,:] = jzg.copy() #图片jzg在左
pj1[:,1280:,:] = lgz.copy() #图片lgz在右
print(pj1.dtype) #查看数组元素类型
pj1=np.array(pj1,dtype=np.uint8) #将pj1数组元素数据类型的改为"uint8"
plt.imshow(pj1) #查看拼接情况
plt.show()
io.imsave('pj1.jpg', pj1) #保存拼接后的图片
纵向拼接
当然,可以横向拼接自然也可以纵向拼接,只需将拼接用的数组改为如下:
pj2 = np.zeros((720 + 720,1280,3)) #横向拼接
将拼接操作改为:
pj1[:720,:,:] = jzg.copy() #图片jzg在上
pj1[720:,:,:] = lgz.copy() #图片lgz在下
然后其他步骤都一样。
图片间距
有些时候要求要有缝拼接,这时候就将拼接用的数组横向或纵向变大,空白区域使用“0”或者“255”填充(我不知道“0”和“255”中,哪个代表白色,哪个代表黑色,需要的就自己去实验或者查询一下)。