shell双变量for循环_双线性插值(采用矩阵运算,无for循环)

最近写深度学习网络需要对feature map进行双线性插值,opencv的resize不能对图像进行批处理,网上找到的双线性插值的代码基本都是三重for循环实现的,效率太低下,干脆自己用numpy库的矩阵运算实现了一个。

双线性插值原理参考:

saulzhang:grid_sample()函数及双线性采样​zhuanlan.zhihu.com

感谢大佬Orz。

import numpy as np

def bilinear_interpolate(source, scale=2, pad=0.5):
	sour_shape = source.shape
	(sh, sw) = (sour_shape[-2], sour_shape[-1])
	padding = pad*np.ones((sour_shape[0], sour_shape[1], sh+1, sw+1))
	padding[:,:,:-1,:-1] = source

	(th, tw) = (round(scale*sh), round(scale*sw))

	grid = np.array(np.meshgrid(np.arange(th), np.arange(tw)), dtype=np.float32)
	xy = np.copy(grid)
	xy[0] *= sh/th
	xy[1] *= sw/tw
	x = xy[0].flatten()
	y = xy[1].flatten()

	clip = np.floor(xy).astype(np.int)
	cx = clip[0].flatten()
	cy = clip[1].flatten()

	f1 = padding[:,:,cx,cy]
	f2 = padding[:,:,cx+1,cy]
	f3 = padding[:,:,cx,cy+1]
	f4 = padding[:,:,cx+1,cy+1]

	a = cx+1-x
	b = x-cx
	c = cy+1-y
	d = y-cy

	fx1 = a*f1 + b*f2
	fx2 = a*f3 + b*f4
	fy = c*fx1 + d*fx2
	fy = fy.reshape(fy.shape[0],fy.shape[1],tw,th).transpose((0,1,3,2))
	return fy

首先是采用np.meshgrid生成目标图像大小的网格,然后根据scale比例去计算目标图像的网格点对应到原图像的坐标(可能为小数),clip存储的值是待插值点p的左下角点坐标,通过clip可以计算得到待插值点p周围四个整点的坐标,通过该坐标到padding中去索引得到这四个点的灰度值f1, f2, f3, f4,之后就是根据双线性插值公式直接计算得到插值结果了。

特别需要注意的地方是np.meshgrid生成的行列数与图像行列数是倒转的,因此最后fy.reshape恢复的时候最后两个维度必须是tw,th(正常思路下是先高(th)后宽(tw)但是这样就会出问题),再用np.transpose()函数去转置最后两个维度。

最后用我家狗子照片测试一下:

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt

if __name__ == '__main__':
	path_list = ['./dog.jpg']
	imgs = []
	for path in path_list:
		im = cv.cvtColor(cv.imread(path), cv.COLOR_BGR2RGB)/255
		imgs.append(im)
	imgs = np.array(imgs).transpose((0,3,1,2))
	interps_0d1 = bilinear_interpolate(imgs, scale=0.1)
	interps_2d2 = bilinear_interpolate(imgs, scale=2.2)
	for im,interp0,interp1 in zip(imgs,interps_0d1,interps_2d2):
		plt.figure()
		plt.subplot(131)
		plt.imshow(im.transpose(1,2,0))
		plt.subplot(132)
		plt.imshow(interp0.transpose(1,2,0))
		plt.title('scale to 0.1 times of the original image')
		plt.subplot(133)
		plt.imshow(interp1.transpose(1,2,0))
		plt.title('scale to 2.2 times of the original image')
		plt.show()

a7cc5d4ffb28959a7c8dde3480eb2f5e.png

放大和缩小都没有问题。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值