深度学习并行加速

日前深度学习已经非常火爆,各种框架也已经很多很方便了。

但是作为深度学习训练的数据量很大,计算很慢。

对于N卡,各家框架已经支持的非常好了,CUDA加速会快很多。

那A卡用户怎么办呢?

A卡真的没有深度学习加速的方法?

A卡有个Radeon Instinst的专门深度学习显卡,据说卖的很好,bat都用它。但是这不是平民用的。

然后发现与CUDA对立的有个叫Opencl(N/A卡都可以用)

基于OpenCL的深度学习工具:AMD MLP及其使用详解

这是 “使用AMD-MLP的API进行神经网络学习” 支持C/C++

于是也有人实现的

Windows 环境下 caffe opencl gpu 加速版安装调试

甚至新闻也报道了:

论文导读 | OpenCL版Caffe:高速跨平台机器学习框架


4  https://developer.amd.com/tools-and-sdks/

但是官网的SDK里并没有说他家做的这个事AMD-MLP。

而是找到的是open64

x86 Open64 Compiler Suite


对于2和3连接还可以再看。

目前结论:AMD还是没有很好的深度学习GPU并行加速解决方案

通用的Opencl各家框架支持的也不好,目前只发现caffe有

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值