MKL-DNN学习笔记 (八)DRRN超分辩率推理代码的实现

最新推荐文章于 2024-05-29 09:47:35 发布

sandmangu

最新推荐文章于 2024-05-29 09:47:35 发布

阅读量748

点赞数

分类专栏：超分辨率重建 MKL-DNN 文章标签：超分辨率重建 C++ MKL-DNN DRRN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sandmangu/article/details/102549437

版权

超分辨率重建同时被 2 个专栏收录

13 篇文章 4 订阅

订阅专栏

9 篇文章 3 订阅

订阅专栏

前面实现了DRRN所需的各个层的MKL-DNN代码模块，接下来就是用各种模块来搭积木了。

对《纯C++超分辨率重建DRRN --改编》的程序改写的时候要注意几点

1. 原来程序里的vl_BatchNorm+vl_Scale+vl_ReLU, 现在可以用一个BatchNorm来代替

2. 原来的vl_nnconv, 现在要改成Reorder+Convolution+Reorder来获得最大性能提升

3. 每一个残差块b输出的数据要和首单位的卷积数据做一个加法，在这里可以给残差块b的最后一个reorder加一个加法的post-ops来实现，这样也可以提升性能

4. DRRN一共有9个残差块组，每个残差块组用到的weights/bias其实是一样的，所以我们在第一组残差块里reorder好了weights之后就可以保存起来，后面的残差块就不用再reorder weights数据了

5. 因为有首单位，2x9个残差块组，尾单位一共20层操作，每层里还有很多组计算模块，搭的时候要小心再小心，一旦出错了很难Debug。（早知道就应该从FSRCNN入手了 ... 那个模型才7层）

6. 中间2x9个残差块组里有大量的重复的内存对象，所以在第一组残差块分配好内存对象以后，后面的残差组计算要尽量的复用，不用每次都重新分配内存。我一开始没注意这个问题，第一次运行的时候12G的内存一下就消耗光了，windows直接假死...

原始纯C++超分辨率重建DRRN --改编代码流程和mkl-dnn版的代码流程流程对比如下

改写好之后赶紧运行一下

看一下运行时间

算上1.203秒的模型加载时间，一次重建图像的过程只需要20.979秒。相比原来纯C++版本的一次重建需要几个小时性能提升巨大 :)

看来Intel的MKL-DNN还是有很多潜力可挖的 :)

最后代码奉上，写的很乱，仅供参考

https://github.com/tisandman555/mkldnn_study/blob/master/drrn_mkldnn.cpp

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
MKL-DNN学习笔记 (八)DRRN超分辩率推理代码的实现

前面实现了DRRN所需的各个层的MKL-DNN代码模块，接下来就是用各种模块来搭积木了。对《纯C++超分辨率重建DRRN --改编》的程序改写的时候要注意几点1. 原来程序里的vl_BatchNorm+vl_Scale+vl_ReLU, 现在可以用一个BatchNorm来代替2. 原来的vl_nnconv, 现在要改成Reorder+Convolution+Reorder来获得最...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。