日前深度学习已经非常火爆,各种框架也已经很多很方便了。
但是作为深度学习训练的数据量很大,计算很慢。
对于N卡,各家框架已经支持的非常好了,CUDA加速会快很多。
那A卡用户怎么办呢?
A卡真的没有深度学习加速的方法?
A卡有个Radeon Instinst的专门深度学习显卡,据说卖的很好,bat都用它。但是这不是平民用的。
然后发现与CUDA对立的有个叫Opencl(N/A卡都可以用)
1 基于OpenCL的深度学习工具:AMD MLP及其使用详解
这是 “使用AMD-MLP的API进行神经网络学习” 支持C/C++
于是也有人实现的
2 Windows 环境下 caffe opencl gpu 加速版安装调试
甚至新闻也报道了:
3 论文导读 | OpenCL版Caffe:高速跨平台机器学习框架
4 https://developer.amd.com/tools-and-sdks/
但是官网的SDK里并没有说他家做的这个事AMD-MLP。
而是找到的是open64
对于2和3连接还可以再看。
目前结论:AMD还是没有很好的深度学习GPU并行加速解决方案
通用的Opencl各家框架支持的也不好,目前只发现caffe有