- 博客(3)
- 资源 (4)
- 问答 (3)
- 收藏
- 关注
原创 C++实战之OpenCL矩阵相乘优化(二)
前言上一篇文章,分析了简单的矩阵相乘在opencl里面的优化kernel代码,每个work-item只负责计算结果矩阵的一个元素。下一步准备每次计算出结果矩阵的块元素,看看计算时间是如何。这个矩阵系列参考国外一个大神的教程: https://cnugteren.github.io/tutorial/pages/page4.html 有每个kernel的详解工程,还有github代码工程。具体分析
2017-11-21 14:51:00 9808 4
原创 C++实战之OpenCL矩阵相乘
简单概念理解在opencl中,有个索引空间NDRange的概念,NDRange是一个N维的索引空间,N可以是1,2,3。NDRange由一个长度为N的整数阵列来定义,他指定了索引空间各个维度的宽度,每个work-item的全局id和局部id,都是N维元组。有多个work-item构成的叫做work-group,作業組的 ID 跟作業項的全局 ID差不多。一個長度為 N 的陣列定義了每個維度上作業組的
2017-11-06 15:54:40 5714 4
原创 cuda 9.0 + vs2015 环境搭建
cuda 9.0 + vs2015总结:搭建还算顺利,全自动,没毛病系统硬件属性: win7 64位 + GTX960 +内存16G先下载安装vs2015,当然vs2017也是可以的,cuda9.0支持2017cuda 9.0 下载地址:https://developer.nvidia.com/cuda-downloads我配置如下:点击下载本地版。
2017-11-06 15:29:01 27270 5
TA创建的收藏夹 TA关注的收藏夹
TA关注的人