![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CUDA
文章平均质量分 74
wesley_2013
大龄学生
展开
-
CUDA(四) CUDA 库函数-----随机数生成cuRAND
此博客为博主的自学笔记 ,欢迎大家共同交流,如果有错误的地方欢迎留言指正。CUDA提供了若干个高速的库函数,先介绍一下比较简单的符点型随机数生成函数-------cuRAND。cuRAND库函数分为可以在GPU的核函数中使用的API(即被__device__关键字修饰的函数)和在主机侧被使用的API(其实内部由GPU的API组成)两种。本次我只介绍被主机侧使用的API。在主机侧使用随机原创 2013-09-29 20:11:02 · 8688 阅读 · 2 评论 -
CUDA(五) 一个入门级求和并行算法
此博客为博主的自学笔记 ,欢迎大家共同交流,如果有错误的地方欢迎留言指正。在各种基础算法中,如排序,求极值,求和,求平均等等,如果用并行的方式进行的计划显然不是很难,但是对于硬件来讲,如果想最大发挥出硬件的性能那并不是一件容易的事情。此次先介绍一个简单的并行求和算法,并初步利用CUDA进行实现,虽然并没有达到最佳的效果,但是为以后的优化进行一下铺垫。求和算法: 对 1,2,3原创 2013-10-01 19:53:24 · 6309 阅读 · 2 评论 -
CUDA(二) GPU核内外内存的分类及特性
以下两图为GPU的核内外内存的分类及特性,以供参考原创 2013-09-23 14:37:54 · 1052 阅读 · 0 评论 -
CUDA(一) GPU计算性能的相关计算公式
今天开始重新学习CUDA,虽然之前也写过一段程序。可因为种种原因没有继续,加之使用的硬件版本比较低端和英伟达的不断创新进步,发现自己已经处于CUDA的菜鸟乐园中。闲话不多说---------开干。今天先将最基本的计算方法重新理解一下,为以后的性能优化打下坚实的基础!!!! GPU设备的单精度计算能力的理论峰值计算公式:单精度计算能力的峰值 = 单核单周期计算次数 × 处理核个数 ×原创 2013-09-23 00:08:38 · 8377 阅读 · 1 评论 -
CUDA(三) 三种memory的活用
此博客为博主的自学笔记 ,欢迎大家共同交流,如果有错误的地方欢迎留言指正。GPU编程时常用的高速访问内存有三种,分别为:register, shared memory, constant memory。以下面一个程序段为例: 设: A_d[ 256 ] , B_d[ 256 * 256 ], C_d[256]为global memory的内存空间。原创 2013-09-23 19:54:26 · 1167 阅读 · 0 评论