自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 【参加CUDA线上训练营】CUDA进阶之路 - Chapter 8 - CUDA流和CUDA工具库

CUDA流、CUDA工具库、结束语

2023-02-11 17:05:30 704 1

原创 【参加CUDA线上训练营】CUDA进阶之路 - Chapter 7 -原子操作

CUDA的原子操作可以理解为对一个Global Memory或Shared Memory中变量进行“读取-修改-写入”这三个操作为一个最小单位的执行过程。它在执行过程中不允许其他并行线程对该变量进行读取和写入操作。CUDA中的原子操作本质上是让线程在某个内存单元完成读-修改-写的过程中不被其他线程打扰。基于这个机制,原子操作实现了对在多个进程间共享的变量的互斥保护,确保任何一次对变量的操作的结果的确定性。

2023-02-11 16:44:38 440

原创 【参加CUDA线上训练营】CUDA进阶之路 - Chapter 6 - 利用共享存储单元优化应用

共享存储单元更进一步、Bank Conflict、利用共享存储单元优化矩阵相乘

2023-02-11 16:27:39 341

原创 【参加CUDA线上训练营】CUDA进阶之路 - Chapter 5 - 多种CUDA存储单元详解

寄存器、shared memory、local memory、constant memory、texture memory、unified memory、global memory、基于ARM平台的Jetson Nano存储单元调用

2023-02-11 15:59:22 596

原创 【参加CUDA线上训练营】CUDA进阶之路 - Chapter 4 - 矩阵乘法

GPU存储单元概述、GPU存储单元的分配与释放、数据传输、GPU实现矩阵乘法、错误检测与事件

2023-02-11 15:23:04 236

原创 【参加CUDA线上训练营】CUDA并行计算基础 - Chapter 3- 初识CUDA

在异构计算系统上进行的并行计算通常称为异构计算(Heterogeneous Computing)。它能够经济有效地实现高计算能力,可扩展性强,能够非常高效地利用计算资源。典型的例子就是Apple Inc.的异构芯片M1。CUDA是一种实现异构计算的编程模型,开发过程中基本是围绕Host和Device展开的。在编程变量命令中常用‘h’和‘d’来区分内存(主存)和显存。

2023-02-11 14:47:13 313

原创 【参加CUDA线上训练营】CUDA并行计算基础 - Chapter 2 - L4T Ubuntu使用介绍

简单介绍L4T Ubuntu上的基本操作,为后续进行CUDA编程做准备。

2023-02-11 14:04:03 695

原创 【参加CUDA线上训练营】CUDA并行计算基础 - Chapter 1 - GPU硬件架构

CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的通用并行计算平台和程序模型,该架构使GPU能够解决复杂的计算问题。它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。开发人员可以使用C语言来为CUDA架构编写程序,所编写出的程序可以在支持CUDA的处理器上以超高性能运行。CUDA官方文档CUDA的软件环境允许开发者使用C++等高级编程语言开发程序。

2023-02-11 13:43:08 449 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除