模型inference加速之融合Conv层与BN层

ChaoFeiLi

于 2022-05-19 15:18:02 发布

阅读量217

点赞数

分类专栏： Pytorch 文章标签： pytorch

本文链接：https://blog.csdn.net/ChaoFeiLi/article/details/124863958

版权

Pytorch 专栏收录该内容

27 篇文章 11 订阅

订阅专栏

参考链接：
https://nenadmarkus.com/p/fusing-batchnorm-and-conv/
https://zhuanlan.zhihu.com/p/94138640
暂时先不看

def fuse_conv_and_bn(conv, bn):
	#
	# init
	fusedconv = torch.nn.Conv2d(
		conv.in_channels,
		conv.out_channels,
		kernel_size=conv.kernel_size,
		stride=conv.stride,
		padding=conv.padding,
		bias=True
	)
	#
	# prepare filters
	w_conv = conv.weight.clone().view(conv.out_channels, -1)
	w_bn = torch.diag(bn.weight.div(torch.sqrt(bn.eps+bn.running_var)))
	fusedconv.weight.copy_( torch.mm(w_bn, w_conv).view(fusedconv.weight.size()) )
	#
	# prepare spatial bias
	if conv.bias is not None:
		b_conv = conv.bias
	else:
		b_conv = torch.zeros( conv.weight.size(0) )
	b_bn = bn.bias - bn.weight.mul(bn.running_mean).div(torch.sqrt(bn.running_var + bn.eps))
	fusedconv.bias.copy_( torch.matmul(w_bn, b_conv) + b_bn )
	#
	# we're done
	return fusedconv

import torch
import torchvision
torch.set_grad_enabled(False)
x = torch.randn(16, 3, 256, 256)
rn18 = torchvision.models.resnet18(pretrained=True)
rn18.eval()
net = torch.nn.Sequential(
	rn18.conv1,
	rn18.bn1
)
y1 = net.forward(x)
fusedconv = fuse_conv_and_bn(net[0], net[1])
y2 = fusedconv.forward(x)
d = (y1 - y2).norm().div(y1.norm()).item()
print("error: %.8f" % d)

ChaoFeiLi

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
模型inference加速之融合Conv层与BN层

参考链接：https://nenadmarkus.com/p/fusing-batchnorm-and-conv/https://zhuanlan.zhihu.com/p/94138640暂时先不看def fuse_conv_and_bn(conv, bn): # # init fusedconv = torch.nn.Conv2d( conv.in_channels, conv.out_channels, kernel_size=conv.kernel_size, strid
复制链接

扫一扫

专栏目录