VS2017 CUDA编程学习4:CUDA并行处理初探 - 向量加法实现

本文介绍了CUDA编程中的向量加法实现,通过对比GPU与CPU的执行时间(GPU耗时约5s,CPU耗时55s),展示了CUDA并行处理的显著优势。在CUDA编程时,需注意设备对block和线程数的限制,以防程序崩溃。
摘要由CSDN通过智能技术生成


VS2017 CUDA编程学习1:CUDA编程两变量加法运算
VS2017 CUDA编程学习2:在GPU上执行线程
VS2017 CUDA编程学习3:CUDA获取设备上属性信息


前言

今天开始见识下CUDA编程的并行处理能力,这里做下笔记并分享给大家。


CUDA实现向量加法

为了体现CUDA并行处理能力,这里也实现了CPU上向量加法程序,通过分别统计运行时间来证明CUDA的并行处理优势。

#include <stdio.h>
#include <iostream>
#include <time.h>
#include <cuda.h>
#include <cuda_runtime.h>
#include <device_launch_parameters.h>

#define N 1000

//内核(Gpu设备)函数实现向量加法
__global__ void GpuAdd(int* d_a, int* d_b, int* d_c)
{
   
	int idx = blockIdx.x;
	d_c[idx] = d_a[idx] + d_b[idx];
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值