CUDA C实践
奔跑熊
个人对图像处理,机器学习,深度学习等领域比较感兴趣,欢迎多交流!
展开
-
CUDA系列三:矩阵相乘
本博文主要讲解下基于cuda的矩阵相乘,cuda特别擅长的就是矩阵乘法,而且也比较容易实现。通过矩阵乘法的实现,可以比较容易理解cuda的核心思想。网上也有很多基于cuda实现的矩阵乘法,但是感觉都不完成,要不就是有错,本文给出的代码都是经过验证可行的,希望能够帮助到大家。矩阵乘法实现方式一:矩阵乘法的逐点实现方式,具体如下图所示 对...原创 2019-05-13 20:33:54 · 14867 阅读 · 9 评论 -
CUDA系列一:基本概念
太久没有写博客了,最近一直在整cuda c这块的东西,学了一阵子了但是水平还是一般般。作为一个半入门的人,写点记录一来是可以帮助自己记忆,更多的是希望可以帮助他人,做技术这块写点东西能够帮助到他人,我想这大概是自己最开心的事情,以后尽量多写些有用的东西吧。1. 基本概念 常用的操作主要包括函数声明,变量声明,内存类型声明,纹理内存,原子操作等。主机:CPU以...原创 2019-05-12 14:29:35 · 675 阅读 · 0 评论 -
CUDA系列二:向量的相加
本文主要介绍下cuda的向量加法的实现,该代码只是为了熟悉概念和初步上手cuda,过程也比较简单。cuda c上手其实还是挺简单的,但是要精通还是需要通过大量实践才能达到的,有兴趣的同学需要多加练习。本文的向量相加,由简逐渐深入。初步实现只使用了一个block:#include <iostream>#define N 10static void Hand...原创 2019-05-12 15:24:47 · 1873 阅读 · 0 评论