自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 CUDA ON ARM PLATFORM(NVIDIA 春季训练营2023)(四)

为了提高多个线程同时访问共享内存的效率,共享内存被划分为32个逻辑块(banks)。第一个bank为0~3字节,第二个bank为4~7字节,以此类推至127字节。由于每个周期内每个bank只能响应一个地址,当同一个warp(线程束)中的不同线程访问同一个bank中的不同地址时就会发生bank conflict。同一个warp中的线程索引为((0, 0), (0, 1), (0, 2), (0, 3),...,(0, 31))相同地址(其他线程未访问该bank的其他地址)

2023-02-10 20:04:57 194

原创 CUDA ON ARM PLATFORM(NVIDIA 春季训练营2023)(三)

GPU的内存包括全局内存(global memory)、常量内存(constant memory)、纹理内存核表面内存(texture memory)、寄存器(register)、局部内存(local memory)和共享内存(shared memory)以及L1、L2缓存(从费米架构开始有了SM层次的L1 cache和设备层次的L2 cache)。常量内存是有常量缓存的全局内存,大小有限,只有64KB。两者类似于常量内存,也是一种具有缓存的全局内存。全局内存是核函数中所有的线程都能够访问的内存。

2023-02-10 14:13:43 164

原创 CUDA ON ARM PLATFORM(NVIDIA 春季训练营2023)(二)

CUDA编程

2023-02-10 00:44:40 123

原创 CUDA ON ARM PLATFORM(NVIDIA 春季训练营2023)(一)

CUDA入门教程

2023-02-06 22:36:23 353

原创 windows_clion_cmake_msys2 boost 安装与配置

# # # # # # # # # # # # 二进制包安装教程及CLion配置教程# # # # # # # # # # # ## # # # # # # # # # # # # 源码安装教程及CLion配置教程# # # # # # # # # # # #1. boost_1_72_0.7z 或 boost_1_72_0.zip 为1.72版本的不同压缩形式的源码。boost分为二进制包(.exe)和源码(.zip的形式)2. 下载后直接运行.exe文件,指定安装目录即安装完毕。

2022-09-03 19:57:26 674

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除