自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 【更新】Nsight System相关(旧:nvvp打开时遇到的问题及解决)

安装还只能安java8,我安装的最新版本会报错。报错的解决:主要参考的是第一个。

2023-12-28 12:00:16 502 1

原创 cuda学习之使用常量内存实现一维模板

学习cuda的教程的时候在常量内存突然看到了一个一维卷积,里面的数据填充的理解消耗了一部分,在这里做一个学习记录。重点在于理解数据填充方法。

2023-12-26 14:52:11 907 1

原创 cuda利用共享内存高效矩阵转置

共享内存的存在可以帮助我们更快速的写入和读取数据,缩短进程时间,以矩阵转置为例,记录一些自己的学习笔记。从全局内存读取数据(按行)写入共享内存(按行)从共享内存读取一列写入全局内存的一行。

2023-12-25 16:21:21 1288

原创 cuda中循环展开和并行归约的代码理解及可视化辅助理解

首先列出参考文献:代码部分:会了么的个人空间-会了么个人主页-哔哩哔哩视频 (bilibili.com)图片及部分理解部分:Cuda C编程权威指南1.并行规约分化+循环展开-CSDN博客逻辑概念上,grid>block>thread也就是,网格>线程块>线程每个核函数的启动都对应着一个grid,grid中的所有block共享全局内存,每个block又是由许多线程构成的(block内的线程共享共享内存)。CUDA中SIMD的基本单位是一个warp(线程束一般是由32个线程组成,共享寄存器)。threadId

2023-12-19 17:31:30 583 1

原创 CUDA安装后例程的运行和空白项目的生成

开始学习网络上其他教程时,需要自己跟着写,这里就可以新建一个空白cuda工程。点击确定后右键源文件,添加项,选择cuda ……下载完CUDA,检查完系统硬件信息,就算是成功安装了。确定后右键新建的文件,点击属性,选择cuda c++然后进来就是有一个已经写好的例程,直接就是可以运行。选择里面的CUDA12.2 Runtime。打开VS2019,点击创建新项目。选择cuda12.2。

2023-12-18 21:00:40 385

原创 Qt和Geant4的安装相关问题

在Qt安装时碰到了一系列bug,正常安装到D盘,装了5.15.2和6.6.2两个版本,在实际打开的时候报错,所以记录下来给自己预备着。

2023-12-05 10:52:12 1069 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除