34542122221-CSDN博客

因为没有识别到VS的路径导致报错，将C:\Program Files (x86)\Microsoft Visual Studio\2017\Professional\VC\Tools\MSVC\14.16.27023\bin\Hostx64\x64添加到高级系统设置---环境变量中，然后重启电脑即可。\TestDemo\cudatest\x64\Release文件夹下）。查询原因是nsys的版本过旧，和cuda11.6不匹配，下载安装nsys2024.1.1，并添加环境变量+重启之后，运行代码，即可通过。

2024-03-18 10:15:32 466 1

原创在bug中学C++语法之函数声明和实现的形参名可以不一致

在bug中学C++语法之函数声明和实现的形参名可以不一致

2024-01-18 09:38:27 395 1

原创 C++中static修饰符的使用(简洁版)

1.static修饰函数中局部变量：改变了局部变量的存储位置，不存储在栈上，存储于进程中的全局数据区，因此，该变量不随函数结束而结束。该变量仅在第一次调用该函数时进行初始化，后续调用时使用前一次存储的数据。2.static修饰全局变量 / static修饰函数：改变该变量的链接属性，只能在当前类使用。

2024-01-06 15:16:41 395 1

原创 CUDA C 循环展开功能 #pragma-unroll

pragma unroll功能可用于控制任意给定循环的展开。字段放在循环之前，仅适用于该循环。#pragma unroll 1 //不展开。#pragma unroll //完全展开。循环展开适用于loop内部代码较少的循环。

2024-01-02 20:30:45 670 1

原创二级制文件数据读取

Time2>Time1 可能由于assign函数效率低于Read，且内存映射在跳着读数据的时候更有优势。vAllDisp.size() = 35843400byte，耗时=0。vectorSize与1相同，耗时0.9s。

2023-12-28 15:40:56 354 1

原创回调函数用法

【代码】回调函数用法。

2023-12-28 08:50:38 329 1

原创 ABAQUS铁木辛柯梁横向剪切系数

2023-12-27 17:07:15 569 1

原创 CUDA学习笔记(CH4)-Global Memory

Device 内存堆具有固定大小，如果没有指定堆大小使用malloc() or __nv_aligned_device_malloc(), 则会分配默认8M的堆内存。1.动态全局内存分配与操作(CUDA C Programming Guide v12.3_10.34)malloc()-free() 和 cudamalloc()-cudafree()要配套使用。个字节，并返回一个指向已分配内存的指针，如果没有足够的内存来满足请求，则返回 NULL。函数从设备堆中分配至少。2.与主机内存间的互操性。

2023-12-14 21:04:25 29 1

原创 CUDA 错误信息输出及报错原因整理

CUDA 错误信息输出及报错原因整理

2023-12-11 15:04:21 221 1

原创 Fortran调用C++函数写法

【代码】Fortran调用C++接口写法。

2023-12-05 09:47:15 72

原创 Fortran error

1.error#6552: The CALL statement is invoking a function subprogram as a subroutine.Fortran调用外部接口，接口返回值错误。Subroutine直接 CALL Function(a,b,c,d)C接口存在返回值，要写出来。

2023-12-01 10:28:42 160 1

原创 CUDA内存查询，数据输出

/int型数据输出。1.cudaMemGetInfo函数。这个返回值为0，不好用，原因不明==

2023-11-17 11:30:51 168 1

原创不同GPU架构对应的计算能力

显卡对应计算能力查询：https://developer.nvidia.com/cuda-gpus。

2023-11-08 20:35:01 39

原创 CUDA版本对应的最低显卡驱动

显卡驱动下载地址: https://www.nvidia.cn/Download/index.aspx?

2023-11-08 20:24:37 132 1

原创 ABAQUS 子程序支持MKL库函数

2.我这里用到了【call dgetrf(……call dgetri(……)】进行矩阵运算，所以子程序代码中要添加【USE LAPACK95】1.修改abaqus环境文件权限，compile_fortran中添加【'/Qmkl:sequential',】

2023-11-03 11:19:08 209 1

原创 ABAQUS关联VS2013 & Fortran2015

①当时报错Error：Cannot determine the location of the VS Common Tools folder.于是添加了这个环境变量，即可通过：C:\Windows\System32。6.关联成功后可运行Abaqus Verification测试关联效果，全部pass即为关联成功~Congratulations!VS2013对应的Visual Studio 12.0。

2023-11-03 09:45:35 951 1

HTMCW的博客

原创修改VS编译配置平台宽度

原创 CUDA 块稀疏矩阵的向量乘

原创 CUDA大数吃小数问题：Kahan’s Summation Formula

转载 CUDA矩阵向量乘的多种优化方案对比

原创 C++数组创建及初始化

原创 CUDA性能分析--metrics指标抓取命令总结

原创 CUDA nvcc报错：identifier “addKernel“ is undefined核函数无法识别

原创 Using C++ to access an ABAQUS output database

原创 Windows系统CUDA_nvprof/ncu/nsys性能分析学习笔记