- 博客(66)
- 资源 (3)
- 收藏
- 关注
原创 Notion同步到CSDN + 构建Obsidian本地博客系统指南
本文介绍了三种将Notion博客同步到CSDN的方法:1. 使用VSCode的Markdown Publisher插件,通过配置浏览器参数实现一键发布;2. 基于Obsidian+PicList+Gitee构建本地笔记系统,通过Python脚本自动处理图片链接;3. 尝试用Python脚本直接对接CSDN API(未成功)。前两种方案分别适合简单发布和需要本地存储系统的用户,第三种方案有待完善。文中详细说明了各方案的操作步骤和常见问题解决方法,并提供了相关参考链接和Python脚本代码。
2025-11-29 16:17:50
1130
原创 从win系统远程使用服务器中的nsight system、nsight compute
本文介绍了如何在Windows系统中远程使用服务器上的Nsight System和Nsight Compute工具。主要内容包括:1)双系统同步安装相同版本的Nsight工具,配置环境变量;2)命令行生成profile文件或直接运行分析;3)Windows远程连接服务器的配置方法;4)解决权限问题的具体方案,如修改文件夹权限或调整NVIDIA驱动配置。文章提供了详细的安装步骤和常见问题解决方案,适用于需要进行GPU性能分析和调试的开发人员。
2025-11-29 13:13:29
188
原创 5 内存架构和数据局部性
本文介绍了CUDA编程中的性能指标和内存体系结构。主要内容包括: 性能指标:包括FLOPS率(每秒浮点运算数)和内存带宽(每秒字节数),用于衡量处理器计算和内存访问能力。程序可分为计算受限型和内存受限型。 内存层次结构:详细分析了CUDA内存模型,包括寄存器(线程私有)、共享内存(块内共享)、本地内存、常量内存、纹理内存和全局内存。重点比较了不同内存的访问速度、容量和生命周期特性。 寄存器与本地内存:寄存器是速度最快但数量有限的资源,本地内存用于存储无法放入寄存器的数据。文章还讨论了寄存器溢出的情况及其对性
2025-11-29 12:55:56
285
原创 4 GPU 计算架构和管理
本文介绍了GPU的流多处理器(SM)架构和线程执行模型。主要内容包括:1) GPU由多个SM组成,每个SM包含多个核心,支持数百线程并发执行;2) 线程以block为单位分配到SM,block内线程可协作但不同block间不能同步;3) block被划分为32线程的warp,作为基本调度单元按SIMD方式执行;4) 线程束分化问题会导致SIMD效率降低,应避免同一warp中线程执行不同分支。文章通过架构图和实例详细解析了GPU的并行计算原理及优化注意事项。
2025-11-29 12:47:13
36
原创 3 多维网络和数据
本文介绍了三个CUDA并行计算的实例应用:1) RGB转灰度图像处理,通过dim3类型组织线程块,每个线程处理一个像素并考虑边界条件;2) 图像模糊滤波,每个线程计算一个输出像素,通过双循环处理滤波核内像素并检查边界;3) 矩阵乘法优化,每个线程负责结果矩阵的一个元素计算,通过网格索引替代双重循环,同时处理非方阵情况。这些案例展示了如何合理设计线程网格与数据映射关系,处理多维数据并行计算中的边界问题。
2025-11-29 12:38:04
34
原创 2、异构数据并行性
本文介绍了CUDA编程的系统架构和内存管理基础。主要内容包括:1) CUDA内存管理API,涵盖主机与设备间的内存分配、数据拷贝、初始化和释放操作;2) 线程模型,详细讲解一维和多维线程网格的组织方式,以及线程索引计算方法;3) 设备函数、核函数和主机函数的定义与区别;4) 线程块大小和网格大小的配置原则。文章通过对比标准C语言与CUDA的内存管理函数,结合示意图和代码示例,帮助理解CUDA并行计算的基本概念和编程方法。
2025-11-26 22:33:13
58
原创 1、CUDA 编程基础
GPU计算的发展历程与重要性。首先回顾了计算机技术的发展,特别是摩尔定律的影响,强调了计算能力的快速提升。然而,随着晶体管尺寸的缩小和频率的停滞,单线程性能增长放缓。为了继续提升性能,多核处理器开始普及,促使软件开发者开始考虑并行计算。介绍了延迟导向设计和吞吐量导向设计的概念,CPU和GPU分别代表了这两种设计方法。GPU是吞吐量导向的,拥有众多弱小的ALU,通过流水线处理提高算术吞吐量。GPU的成功在于其高并行性和高吞吐量,以及能够分摊高昂的固定成本的大量销售额。
2025-11-16 20:38:34
505
原创 安装 cuda 版本 PyTorch(2025)
本文介绍了在Windows 10系统上安装CUDA和cuDNN,并配置CUDA版PyTorch的完整流程。主要内容包括:1)安装适合的CUDA/cuDNN版本,通过nvcc -V验证;2)使用Anaconda创建Python 3.11虚拟环境,从PyTorch官网获取对应CUDA版本的安装命令;3)通过torch.cuda.is_available()验证安装结果。若出现CPU版本误装问题,提供了彻底卸载、清理缓存后重新安装CUDA版本的解决方案,特别强调安装命令中需明确指定+cu126参数以确保安装正确的
2025-08-06 14:05:14
1528
原创 conda 环境配置国内镜像加速(2025)
本文介绍了在conda环境中配置国内镜像源以加速conda和pip下载的方法。1)conda配置:通过添加清华镜像源(包含官方、PyTorch、NVIDIA等仓库),并设置显示通道地址;2)pip配置:提供临时使用和永久配置两种方式,推荐通过配置文件永久设置阿里云等镜像源。配置后可通过命令验证是否生效,还提供了恢复默认配置的方法。这些设置能显著提升软件包下载速度,特别适合国内开发者使用。
2025-08-06 11:52:13
5750
原创 VisualStudio — Release 模式下进行调试
如果需要在调试过程中,查看各种变量的信息,就需要禁用优化项,否则在单步调试时很多变量的信息被优化掉无法查看。C/C++ -> 常规 -> 调试信息格式 设为:用于“编辑并继续”的程序数据库 (/ZI)链接器 -> 调试 -> 生成调试信息 设置为: 生成调试信息 (/DEBUG)C/C++ -> 优化 -> 优化 设为: 禁用优化。调试信息的符号文件 .pdb 是调试时的必须文件。
2025-02-07 13:32:58
916
转载 cmake原理、语法
宏功能使用cmake命令后紧跟的目录,一般是工程的根目录执行cmake命令的目录当前处理的CMakeLists.txt所在的路径target 编译目录重新定义目标二进制可执行文件的存放位置重新定义目标链接库文件的存放位置返回通过PROJECT指令定义的项目名称项目实际构建路径,假设在build目录进行的构建,那么得到的就是这个目录的路径。
2024-03-04 15:00:08
279
原创 5_SqlSugar实体中的细节
当更新一个实体对象时,实体中包含time属性,即便没有设置新的时间,更新操作自动根据数据库时间更新该字段。如果不需要更新,则不应该加该注解。插入操作:true数据库时间。更新操作:true数据库时间。
2023-09-25 13:40:40
995
原创 Git拉取分支、基于主分支创建新的开发分支、合并开发分支到主分支、回退上一次的merge操作
如上面的例子中,从 git show 命令的结果中可以看到,merge commit 的 parent 分别为 84a157d7和 1928b1a4,其中 84a157d7 代表 主要 分支(从图中可以看出),1928b1a4 代表 will-be-revert 分支。这里用-m指定保留的分支。如果直接使用 git revert ,git 也不知道到底要撤除哪一条分支上的内容,这时需要指定一个 parent number 标识出"主线",主线的内容将会保留,而另一条分支的内容将被 revert。
2023-08-22 15:54:25
8046
原创 6_AccessKeyId和AccessKeySecret的环境变量配置
很多SDK需要从环境变量中读取key,读取不到会报下列错误。java.util.concurrent.ExecutionException:n.aliyun.sdk.gateway.pop.exception.PopClientExceptibn:件(Code: MissingAccessKeyld Message: code: 400ACcessKevld is mandatory for this action.下面分别介绍不同系统中 AccessKeyId和AccessKeySecret的配置。
2023-08-15 14:29:59
3993
1
原创 5_docker-compose多服务统一编排管理
单独运行容器有很多问题先后顺序要求固定多个run命令,操作繁琐容器间的启停或宕机,有可能导致IP地址对应的容器实例变化,映射出错。要么生产IP写死(可以但是不推荐),要么通过服务调用解决方法:使用compose服务编排,一个配置文件,一条指令管理所有服务。
2023-08-15 14:13:23
531
原创 3_Docker安装redis
将宿主的文件和容器内部目录相关联,相互绑定,在宿主机内修改文件的话也随之修改容器内部文件。进入主机的redis.conf文件。配置文件方式启动redis 容器。
2023-08-02 10:45:15
347
原创 1-JVM体系结构
不同平台CPU架构不同,所以不能设计为基于寄存器的。优点是跨平台,指令集小,编译器容易实现,缺点是性能下降,实现同样的功能需要更多的指令。
2023-03-05 22:33:51
213
原创 C#文件路径操作、文件操作
C#文件路径操作、文件操作。常用函数 需要引用System.IO 直接可以调用Path的静态方法。文件重命名并复制到指定路径。
2023-02-24 14:44:30
1987
原创 2_Docker安装jdk1.8和MySql
注意由于新版本,这里要先在主机conf文件夹下,建立conf.d和mysql.conf.d两个文件夹,再运行创建MySQL的容器即可。可选用-v指令,将容器/var/log/mysql等目录挂载到主机/mydata/mysql/log等目录。
2023-01-30 11:22:59
1385
原创 1_Linux安装Docker
确定你是CentOS7及以上版本5。第1章 Linux安装Docker。a. 先确认CentOS7能上外网。e. 从容器内拷贝文件到主机上。本次安装时间2021.11。安装DOCKER CE。设置stable镜像仓库。更新yum软件包索引。yum安装gcc相关。
2023-01-30 11:08:58
207
原创 剑指 Offer 40. 最小的k个数
输入整数数组 arr ,找出其中最小的 k 个数。例如,输入4、5、1、6、2、7、3、8这8个数字,则最小的4个数字是1、2、3、4。
2023-01-17 13:35:31
129
原创 剑指 Offer 30. 包含min函数的栈
定义栈的数据结构,请在该类型中实现一个能够得到栈的最小元素的 min 函数在该栈中,调用 min、push 及 pop 的时间复杂度都是 O(1)。
2023-01-13 11:34:14
132
原创 剑指 Offer 09. 用两个栈实现队列
用两个栈实现一个队列。队列的声明如下,请实现它的两个函数 appendTail 和 deleteHead ,分别完成在队列尾部插入整数和在队列头部删除整数的功能。(若队列中没有元素,deleteHead 操作返回 -1 )
2023-01-13 10:32:17
115
原创 13_多版本并发控制
MVCC (Multiversion Concurrency Control),多版本并发控制。是通过数据行的多个版本来实现数据库的并发控制。它使得在InnoDB的事务隔离级别下执行一致性读操作有了保证。换言之,就是为了查询一些正在被另一个事务更新的行,并且可以看到它们被更新之前的值,这样在做查询的时候就不用等待另一个事务释放锁。是采用乐观锁思想的一种方式。4个隔离级别中,第1种READ UNCOMMITTED和第4中SERIALIZABLE读到的数据都是最新的版本,不使用MVCC。
2022-12-21 18:10:57
498
esp8266_quick_start_guide_cn快速入门指南.pdf
2019-06-10
通过串口调试工具读写PLC.docx
2019-06-10
FX编程口协议.pdf
2019-06-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅