CUDA学习入门（一）（包含CUDA安装和相关基础知识）

BAs533

已于 2024-01-21 17:07:36 修改

阅读量5.1k

点赞数 24

分类专栏： Jetson 学习记录文章标签： linux ubuntu gpu算力

于 2024-01-19 20:39:20 首次发布

本文链接：https://blog.csdn.net/weixin_44222088/article/details/135694581

版权

Jetson 学习记录专栏收录该内容

10 篇文章 0 订阅

订阅专栏

CUDA学习入门（一）

前言
一、初识CUDA
二、CUDA程序的编写

前言

本篇只是对CUDA入门有一个宏观的概述，并不涉及具体编程细节，是关于CUDA基础信息的科普性文章，适用于想简单了解什么是CUDA，以及对CUDA工作流程感兴趣的小伙伴。

一、初识CUDA

1.1 什么是CUDA

CUDA是一种由NVIDIA公司推出的通用并行计算架构。它的主要目的是让开发者能够利用GPU（的强大计算能力来进行通用计算，这种计算方式通常被称为GPGPU（General-Purpose computing on Graphics Processing Units）。CUDA提供了一种并行程序模型，允许开发者定义并控制大量的并行线程的执行，这些线程可以被组织成线程块和线程组。CUDA核心是运行在这些线程上的特殊函数，它们能够在GPU上并行执行任务。

在这里插入图片描述

CUDA：

Compute Unified Device Architecture
基于C/C++的编程方法
支持异构编程的扩展方法（下方会介绍异构编程）
拥有简单明了的APIs，能够轻松的管理存储系统，能更快更好地使用GPU
CUDA支持的编程语言：

C/C++/Python/Fortran/Java/…

在这里插入图片描述
如上图所示，在整个计算机体系中，最底层自然是由CPU、GPU等硬件组成的

硬件之上就是操作系统及其相关驱动接口

咱们的CUDA在整个计算机里呢是位于系统层之上的

而我们所需要学习的则是在CUDA的更上一层（上图红框所示）

也就是说，我们是在CUDA基础之上进行并行计算设计和数值方法处理，我们调用CUDA及其相关接口去完成一系列的APP应用设计。

1.2 异构计算

在NVIDIA的GPU上进行编程任务，我们需要了解什么是GPU与异构计算。

了解GPU的异构计算，我们需要对CPU和GPU有明显的区分，需要搞清楚下面的两个概念（术语）。

Host CPU和内存（host memory）
Device GPU和显存（device memory）

其实我们的GPU刚开始是叫做协处理器，它并不是单独的在计算机中去执行任务，而是去协助我们的CPU乃至整个计算机系统去完成一个整体任务。

如下图所示，我们把5%甚至更少的代码量放到GPU上去跑，虽然代码量少，但是执行的计算任务却很多。把更多的计算任务放到我们的GPU上，让GPU和CPU一起协作完成任务，这就是所谓的异构计算的一部分。

在这里插入图片描述

总的来说，所谓异构，是指CPU、DSP、GPU、ASIC、协处理器、FPGA等各种计算单元、使用不同的类型指令集、不同的体系架构的计算单元，组成一个混合系统来执行计算。

有了这个概念打底，可以为后续我们学习CUDA编程，区分CPU代码和GPU代码做基础。

1.3 CUDA安装

适用设备：

所有包含NVIDIA GPU的服务器、工作站、个人电脑、嵌入式设备等电子设备
软件安装：

Windows：CUDA Installation Guide for Microsoft Windows
只需要安装一个.exe可执行程序就好

Linux：NVIDIA CUDA Installation Guide for Linux
按照上面的教程，需要6/7个步骤即可

Jetson：JetPack SDK
直接利用NVIDIASDK Manager 或者 SDimage进行刷机即可

Jetson刷机可以参考：Jetson Nano官方镜像下载&烧录
查看当前GPU状态的命令：

服务器、工作站、个人电脑：nvidia-smi
Jetson等设备：jtop