软件角度解读cuda

1.什么是gpgpu

图形加速器进行通用型计算。卷积、深度学习等基本算子都是矩阵运算。(卷积操作、反卷积操作

2.什么是cuda

Compute Unified Device Architecture

可以做传统意义上的科学计算,可以做深度学习算法的计算部署。不仅代表一个类c的编程语言,同时也代表nv这一套监控性能、调试的工具链

overview

写一个cuda程序并不困难,困难的是如何利用硬件尽可能地榨取cuda的性能,比如一个浮点运算,如何尽可能地接近性能的峰值。

CUDA-C

包含host代码(cpu代码),gpu代码。串行在cpu端跑,并行在gpu上执行。
在这里插入图片描述

CUDA的硬件设备和线程

计算设备

  • 和cpu或者host协作
  • 有自己独立的dram
  • 可以并行地跑很多的线程
  • 一般而言是gpu,但是也可以是其它类型的并行处理设备

gpu和cpu线程的区别

  • gpu线程非常轻量
  • gpu可以同时跑几千几万个线程(GPU的线程几倍-几十倍于gpu)

!

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6Vimru77-1663642897703)(%E8%BD%AF%E4%BB%B6%E8%A7%92%E5%BA%A6%E8%A7%A3%E8%AF%BBcuda%20ae2c445c594242ea8e6fb866d90a89d0/Untitled%202.png)]

ptx 中间层代码 ptx会根据具体的target进行gpu code的编译

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值