cuDNN概览

NVIDIA cuDNN为深度学习中频繁使用的操作提供了高度调优的实现:

  • 前向、反向卷积,以及互相关。
  • 矩阵乘
  • 前向、反向池化
  • 前向、反向Softmax
  • 前向、反向激活:relutanhsigmoidelugelusoftplusswish
  • 算术、数学、关系和逻辑关系的逐点运算(包括各种类型的前向、反向激活)
  • 张量转换函数
  • 前向、反向LRN,LCN,batch normalization,instance normalization,以及layer normalization

cuDNN不仅提供单个op的高性能实现,还支持一系列灵活的多op融合模式,用于进一步优化。cuDNN库的目标是在NVIDIA GPUs上为重要的深度学习用例提供最佳性能。

在cuDNN 7及之前的版本,各深度学习op以及融合模式被设计为一组固定的API,称为"legacy API"。从cuDNN 8开始,为了支持对流行的融合模式进行快速扩展,新增了"Graph API",这些API允许用户通过定义计算图来表达计算,而不是通过一组固定的API调用来选择计算。这比"leagcy API"提供了更好的灵活性,对于大多数用例,现在推荐使用"Graph API"。

注意,cuDNN库同时提供了C API和一个开源的包裹C API的C++层,C++层可能对大部分用户来说更加方便。但是,C++层只支持"Graph API",不支持"legacy API"。

最新文章和代码都放在github master-cudnn上,期待star。

  • 6
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值