【超算/先进计算学习】
文章平均质量分 94
根人才计划
鱼树C
心有所向,日复一日,必有精进
展开
-
【超算/先进计算学习】日报8
在学习的第一阶段,我们首先对需要优化的程序——Darknet框架进行了了解,其具有灵活性高、结构明晰、安装简单方便等特点;rm [-rf] [filename or directoryName] 目录以及文件的删除。mv [filename] [object_directiryName] 文件/目录的移动。cp [source_filename] [dest_filename] 文件/目录的拷贝。mv [old_filename] [new_filename] 文件/目录的重命名。原创 2023-04-28 23:08:28 · 1102 阅读 · 0 评论 -
【超算/先进计算学习】日报7
通过对 darknet 项目进行优化,了解了传统程序优化的基本流程,并对之前所学的内容有了很好的检验,个人认为学习阶段最终结果并不重要,重要的是掌握项目优化的思路和所用的工具。这个是 去掉 -pg 选项的执行情况,个人认为提升不是很大就没有再继续了,想要优化到极致的可以反复上述过程,不断寻找耗时长的函数对其使用尽可能多的优化手段!注意:每次对源码进行修改之后都要重新 make,加上 -pg 选项只是为了之后方便了解程序运行的详情,方便优化,但这本身会产生一定的开销,最终版需要去掉。原创 2023-04-25 22:17:26 · 475 阅读 · 4 评论 -
【超算/先进计算学习】日报6
当一个循环体中包含一个以上的循环,且循环语句之间不包含其他语句,则称这个循环为紧嵌套循环,交换紧嵌套中两个循环的嵌套顺序是提高程序性能最有效的变换之一。实际上,循环交换是一个重排序变换,仅改变了参数化迭代的执行顺序,但是并没有删除任何语句或产生任何新的语句,所以循环交换的合法性需要通过循环的依赖关系进行判定。最近对传统性能优化的一些方法进行了学习,了解了传统性能优化的原理 (与计算机体系结构和缓存的关系),通过这些优化方法程序的执行效率确实得到了显著的提高,是非常重要且实用的技术。原创 2023-04-24 19:26:38 · 812 阅读 · 0 评论 -
【超算/先进计算学习】日报5
main函数分别调用了testfunc1函数( 10 )次,testfunc4函数( 1 )次,testfunc3函数( 1 )次,testfunc2函数( 1 )次。Gprof 是一款易用的动态分析工具,除了函数的调用关系,同时还能给出函数的调用时间分布,为我们的性能分析提供参考,快速定位程序的热点函数位置。今天主要对程序性能分析的概念和常用工具进行了了解,并使用 gprof 对一些简单程序进行了分析和解读,还是挺有收获的。静态分析,即利用代码静态分析工具,对代码进行数据对象、函数接口封装和调用分析。原创 2023-04-22 19:49:49 · 922 阅读 · 0 评论 -
【超算/先进计算学习】日报4
基于块划分的方式,例如:如果有两个进程,会把一个向量的上半部分划给 P0,下半部分划给 P1,同样将矩阵的上半部分划给 P0,下半部分划给 P1,中间需要进行信息交换处会由 PETSc 自动进行管理。SpMV 优化的重点在于改良稀疏矩阵的存储结构,提升稀疏矩阵向量乘时的 Cache 命中率,并充分利用 CPU 内部硬件特性,或者多核平台来改善效率。1、如果 A 的性质不那么好,是病态的,或者主对角线上的元素很小,或者特征值很小,那么收敛起来就会非常慢。算法库:是计算领域的基础软件库,是发挥硬件算力的基石。原创 2023-04-21 16:54:16 · 785 阅读 · 3 评论 -
【超算/先进计算学习】日报3
对于一个可执行文件 saxpy.exe,通过 slurm 系统,编写 shell 脚本 yhrun.sh,通过 yhrun 命令把程序二进制文件提交到计算节点进行串行计算,使用 yhbatch 命令,提交 yhrun.sh 脚本,使程序在后台运行。今天的学习内容较少,初次了解作业管理系统slurm,感觉这种远程计算的方式还是挺新鲜的,期待之后的学习内容 (≧∇≦)ノ。-n:指定程序使用的总进程数目,每个节点启动约 n/N 个进程,整除。frame [n],简写 f [n],查看调用栈的 #n 层。原创 2023-04-19 18:55:55 · 1061 阅读 · 0 评论 -
【超算/先进计算学习】日报2
现有一个程序,包含main.cpp、kernel.cpp源文件,并使用了/home/opt/路径下的第三方库mymath,其中opt路径下包含头文件./include/mymath.h和库文件./lib/libmymath.so。示例:需要编译 main.c、kernel.c 成 exe,其使用了 /home/opt/ 路径下的第三方库 math,其中 opt 目录下包含:/include/mymath.h、/lib/mymath.so。前面那个 -l 是大写的 i,后面那个 -l 是小写的 L。原创 2023-04-18 17:14:24 · 561 阅读 · 0 评论 -
【超算/先进计算学习】日报1
使用C语言编写的神经网络框架支持训练和测试各种计算机视觉算法可用于进行实时物体检测1、相比于TensorFlow等具有更好的移植性2、灵活性高,可以便捷的从底层对其进行代码改进与扩展3、结构明晰,可以方便的对源代码进行查看、解读和修改4、安装简单方便,通过自带的makefile可进行附加项的选择Makefile变量中各种开关的作用GPU=0:是否使用GPU加速CUDNN=0:是否使用nvidia官方的cudnn神经网络OPENCV=0:是否使用opencv。原创 2023-04-17 19:51:31 · 1253 阅读 · 1 评论