Cudnn v5.1与V 6.0的特性

最新推荐文章于 2024-07-17 16:15:02 发布

jacob_wjj

最新推荐文章于 2024-07-17 16:15:02 发布

阅读量5.3k

点赞数 2

分类专栏：深度学习文章标签： cudnn-caf

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jiangbo1017/article/details/75084608

版权

CUDNN v6引入了空洞卷积、一维FFT卷积、cudnnReduceTensor接口、deterministic max pooling模式等新特性，同时增强了对8位整型数据推理的支持。移除了部分旧版API，并修复了Dilated Convolution在Kepler GPU上的错误。CUDNN API遵循向后兼容策略，逐步淘汰旧版本接口。

摘要由CSDN通过智能技术生成

V5.1

新增特性

针对3*3以及5*5de 卷积核，添加了新的Winograd卷积算法，提供前向和后向计算。可以通过使用CUDNN_CONVOLUTION_FWD_ALGO_WINOGRAD_NONFUSED,CUDNN_CONVOLUTION_BWD_DATA_ALGO_WINOGRAD_NONFUSED以及CUDNN_CONVOLUTION_BWD_FILTER_ALGO_WINOGRAD_NONFUSED触发使用。
cudnnConvolutionBackwardData以及cudnnConvolutionBackwardFilter扩展了针对FP16计算的支持
为很多常用的例子优化了LRN的性能

cudnn5.1与cudnn5.0接口保持完全兼容

V6

新增特性

空洞卷积（也称为膨胀卷积）Dilated Convolutions。目前在Cudnn中添加了对Dilated Convolution的支持，这一支持并未改变API。之前在Convolution Descriptor中未使用的域“upscale”,被定义成允许用户指定每个维度上的膨胀因子。当前对dilation的支持可以通过一下代码路径获取，
Forward：CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_GEMM
Backward Data: CUDNN_CONVOLUTION_BWD_DATA_ALOGO_0
Backward Filter: CUDNN_CONVOLUTION_BWD_FILTER_ALGO_0
新添加的接口cudnnConvolutionBiasActivationForward允许单个kernel中混合Convolution, bias以及activation操作。目前只支持单通道bias以及RELU激活函数。

最低0.47元/天解锁文章

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

jacob_wjj CSDN认证博客专家 CSDN认证企业博客

码龄13年

77: 原创

17万+: 周排名

206万+: 总排名

12万+: 访问

: 等级

1915: 积分

44: 粉丝

42: 获赞

6: 评论

109: 收藏

私信

关注

热门文章

分类专栏

最新评论

Ｍｉｘｅd-precision(混合精度训练)
WUT ISC: 排版都不会排清楚先别发帖吧
Swig实现将C、C++编译成Python动态链接库
Deep Learning小舟: 好棒！(^ ^)
Tensorflow MPI Enable Intro
youzhenfei1995: 您好，请问这个问题您解决了吗，能不能推荐一些资料，tensorflow MP这方面能够I能够查到的资料太少了
OpenCV 2.4.13.16 + cuda 9 + centos7 编译
wangzai6378: 你好，我现在也在弄这个；我编译的是opencv3.4+cuda9.1；也是想使用其中的硬解功能，在opencv3.4中已经像你上面这样配置好了，编译过程还算顺利。我在使用是总是会报createVideoSource函数未初始化的错误，我再自己的工程中也进行了上面的初始化，我没有把dynlink_nvcuvid.cpp、dynlink_cuda.cpp加入一起编译。在自己的demo工程中我同样包含了dynlink_nvcuvid.h头文件，进行初始化时报链接错误，于是我把上面的两个cpp也加入到工程中一起编译，这时编译通过了；但运行时cv::cuda::createVideoReader在调用createVideoSource函数时，还是报该函数异常访问，我自己也测试了，在调用cv::cuda::createVideoReader之前直接使用createVideoSource，但这样我自己调用的这个是可以的，这是怎么回事啊？请教，另外toolkit9中的nvcuvid.lib有什么用，我看百度上面有一个人是用它直接就解码了，没有依赖dynlink_nvcuvid.cpp...
tensorflow内存分配器剖析
qq_38343816: 请问这一段位于TensorFlow源码的哪个位置呢

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。