CUDA优化入门实战
文章平均质量分 72
试试看用CUDA做些简单优化
Swaggie
Lead by Example
展开
-
【CUDA优化入门实战】用CUDA做个简单的矩阵乘法再来优化看看
用CUDA做个简单的乘法(cuda_float.cu)注:本markdown代码部分格式高亮基于c代码详见(https文章目录用CUDA做个简单的乘法(cuda_float.cu)先来试试基本的矩阵乘法(1.0)来尝试一下第一次改良把!(改良2.0)可以试试不被记忆体的频宽限制进行改良吗?(改良3.0)还有什么改进空间吗?(改良4.0)先来试试基本的矩阵乘法(1.0)简单起见,我们这里先采用方形矩阵举例:假设有两个矩阵 A跟 B,计算 AB=C 可以用以下代码表示for(i = 0; i <原创 2022-05-07 16:47:22 · 823 阅读 · 0 评论 -
【CUDA优化入门实战】试试看优化CUDA上的加法吧
注:本markdown代码部分格式高亮基于c代码详见(https://github.com/H-Freax/CUDA_optimization)试试看优化CUDA上的加法吧(cuda_sum2.cu)先来试试并行化(优化1.0)在cuda_sum1.cu中,并没有进行并行化,整个程序只有一个thread,效果并不是很好。这主要是因为GPU的架构导致的,在CUDA中,一般的内容复制到显示记忆体中的部分,即global memory,这些部分是没有cache的,而且存取global memory的时间原创 2022-04-17 18:37:14 · 727 阅读 · 0 评论 -
【CUDA优化入门实战】用CUDA做个简单的加法
用CUDA做个简单的加法(cuda_sum1.cu)该部分在first_cuda.cu的基础上进行目标是计算一堆数字的平方和首先把开头部分改成#include<stdio.h>#include<stdlib.h>#include<cuda_runtime.h>#define DATA_SIZE 1048576int data[DATA_SIZE];编写生成随机数的函数void GenerateNumbers(int *number, int si原创 2022-04-16 18:40:05 · 1191 阅读 · 1 评论 -
【CUDA优化入门实战】新建一个CUDA项目
注:本markdown代码部分格式高亮基于c++代码详见(https://github.com/H-Freax/CUDA_optimization)新建一个CUDA项目(first_cuda.cu)首先需要引用所需的库要使用到runtime API的时候需要引用cuda_runtime.h#include <stdio.h>#include <cuda_runtime.h>编写主函数部分判断CUDA是否可用int main(){ if(!InitCUDA(原创 2022-04-13 20:57:03 · 573 阅读 · 0 评论