【原创】CUDA并行计算

本文详细介绍了CUDA并行计算的基本概念,包括GPU及CUDA的概述,CUDA编程模型。内容涉及GPU的硬件架构,CUDA编程中的核函数、线程组织以及影响CUDA程序性能的关键因素。文章强调了理解GPU硬件对于优化CUDA程序的重要性,并指出性能调优通常需要结合硬件参数进行尝试和测量。
摘要由CSDN通过智能技术生成

本文为作者原创,转载请注明出处

CUDA并行计算

本文叙述性的讲解cuda并行编程相关原理,可以看作是cuda编程的总结和提炼;

GPU及CUDA概述

gpu是一种插入式卡,是cpu的一个协处理器,早期的gpu主要专注于浮点运算,作为cpu的补充,用于游戏等应用中,后来人们意识到gpu可以用于科学计算,因此出现了GPGPU以及CUDA;


gpu板卡主要由五部分组成:1)负责所有计算的gpu芯片,2)gpu内存(显存,与cpu的DRAM相似),3)PCI接口芯片,4)电源芯片,5)使这些芯片能一起工作的其它半导体芯片;
gpu计算芯片与cpu芯片在体系架构上有很大不同,主要体现在:1)gpu核心更多,一般可以达到几百几千个核心,而cpu核心较少,一般只有几个或者几十个,gpu能获得更好的并发性,且gpu启动线程的开销远小于cpu,2)gpu核心的工作频率更低,且结构更加简单,更低的工作频率可以使得gpu芯片获得更低的功耗性能(功耗与频率的平方成正比),简单的结构使得gpu核心可以获得更小的面积;


并行程序开发者可以通过cuda编程模型开发并行计算程序,cuda程序同时包含cpu端(主机端)代码和gpu端(设备端)代码,cpu端代码一般负责串行逻辑部分,gpu端代码一般负

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值