![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CUDA
GaryGao99
这个作者很懒,什么都没留下…
展开
-
CUDA安装
CUDA安装一:在NVIDIA官网下载安装包:cuda_6.0.37_linux_64.run关闭图形用户界面 init3以root身份登录,执行:#./ cuda_6.0.37_linux_64.run 默认安装位置:/usr/local/NVIDIA_CUDA-6.0_Samples配置CUDA开发环境变量二:将cuda bin和lib64目录原创 2015-08-06 17:01:15 · 607 阅读 · 0 评论 -
CUDA C 矩阵乘优化
使用分块的矩阵乘法是比较常用的优化矩阵乘法的方式,作为初学CUDA的人来讲理解起莱还是略微有点困难的。同时矩阵乘法在HPC工程师面试的过程中也是被经常提到的。在CUDA的sample的目录下就有矩阵乘的程序,本简化其程序,尽可能间接清楚其中实现的代码。原创 2016-06-24 14:48:51 · 2615 阅读 · 0 评论 -
cublas vs nervana
测试nervana 与 cublas的性能:矩阵A:[M,K]矩阵B:[K,N]矩阵C:[M,N]C = A * Bcode:test_nervana_vs_cublas.cpp#include #include #include #include #include #include "timer.h"using namespace std;#defi原创 2017-06-05 19:23:52 · 1095 阅读 · 1 评论