【CUDA编程】学习笔记(一) Hello CUDA

前言

本系列博客做为CUDA编程学习的笔记,因为最近比较忙,内容从简,只做一些大体的记录。作为初学者,错误之处还请见谅。

一、什么是GPU

GPU的全称是Graphics Processing Unit,即图形处理器,是进行图像运算的微处理器。
GPU具有高速的浮点运算能力和带宽,并且应用广泛。
从浮点运算来讲,GPU的运算速度是等价位CPU的几十倍。

GTX980理论计算能力是4.6TFLOPs,即4.6×10^12/s
⾄强E5 2640 v2的浮点计算能力约为0.2TFLOPs
前者大约是后者的23倍

带宽角度可以看下面这个例子:

GTX980的显存带宽是224GB/s
DDR3 2133的显存带宽是16.6GB/s
前者大约是后者的13.5倍

二、英伟达GPU的架构(简要)

在这里插入图片描述
上图可以发现,CPU有若干个核心,每个CPU有一个本地的存储,处理器之间共享一块全局内存。而GPU一个处理器有一组核心构成。简单的说,一个是多核,一个是众核。
图中GPU一个Processor和Memory构成一个Streaming Multi-processor(SM)
在这里插入图片描述

三、Hello CUDA

下面简单介绍一下CUDA编程的语法:
在这里插入图片描述
大体有这么几个过程:分配显存→数据从主机复制到GPU→调用内核函数→数据从GPU复制回主机→释放显存
在这里插入图片描述

四、阿姆达尔定律

在这里插入图片描述
其中rs = ts / (ts + tp)

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值