- 博客(97)
- 收藏
- 关注
原创 DeePMD-kit 配置环境备忘
Horovod支持TensorFlow、PyTorch、MXNet和Keras等多个深度学习框架,并提供了一些高级功能,如弹性训练、动态调整学习率和容错机制等。它可以在Linux、OS X和Windows上运行,是为Python程序创建的,但可以打包和分发任何软件。它提供了一些高级功能,如非阻塞通信、组通信和拓扑通信等,同时也支持NumPy数组和Python对象的通信。使用Horovod可以显著提高深度学习模型的训练速度和规模,特别适用于大规模数据和复杂模型的训练。
2023-04-09 20:43:01 1045
原创 蓝桥小小结
想到数列的值就是 b [1] 的值 操作有对b[1]和b[n+1]等价,eg 假设一开始 b [1] 为 2,abs (pos-neg) 为 3,b [1] 的取值可能为 2,3,4,5,即 abs (pos-neg)+1。差分数组数组的操作 b [l] += 1,b [r+1] -= 1 的特性可以使正负两个数相消,所以最后差分就只剩同符号的数,此时操作数为 min (pos,neg) //pos 为差分数组中正数和 neg为负数和的绝对值。方案一 b [1] += 1,b [i+1] -=1;
2023-03-22 12:01:40 457 2
原创 蓝桥(7)
给定三个整数数组第一行包含一个整数N。第二行包含N个整数A1, A2, … AN。第三行包含N个整数B1, B2, … BN。第四行包含N个整数C1, C2, … CN。一个整数表示答案27提示:对于30%的数据,1
2022-11-15 20:01:24 155
原创 蓝桥(6)
信息组的成员都来到了机房给RB过生日,就在RB插完N根蜡烛准备点蜡烛时,RB神奇的发现,每隔一秒,RB插下的N根蜡烛就会按照一定规律变换顺序,可是有强迫症的RB一定要让蜡烛按原本排好的顺序点燃,所以RB只能等,可是RB又赶着时间去上课,那么问题来了,RB最快几秒钟后可以点蜡烛呢?小X性格很独特,如果她今天高兴度比上次一样或更高,她就会很善良,相反,如果她今天高兴度比上次低,她就会很凶!接下来的K行每行包含N个不同的整数(从1到N),该整数表示每列士兵所在行的身高(1表示最高,N表示最矮)
2022-11-09 00:07:25 370
原创 常见代码优化(1)
forprivate(,)schedule()核心:由于每行的非零元素的个数可能差异巨大,为了减少负载均衡的问题,使用动态负载均衡策略,size大小的确定需要考虑。把 rowStart,rowEnd 在循环内声明就不需要 private(rowStart,rowEnd)
2022-11-08 23:53:29 200
原创 蓝桥(5)
对于这么简单的情况,显然,至少需要交换 2 次就可以复位。经过若干次后,使得瓶子的序号为:1 2 3 4 5。输出一个正整数,表示至少交换多少次,才能完成排序。第二行包含 N 个整数,表示瓶子目前的排列状况。有 N 个瓶子,编号 1∼N ,放在架子上。要求每次拿起 2 个瓶子,交换它们的位置。第一行包含一个整数 N ,表示瓶子数量。比如有 5 个瓶子:2 1 3 5 4。你可以通过编程来解决。最终形式即 出现n个环(n个自环)
2022-10-24 21:55:09 264
原创 蓝桥(4)
此时若将区间s[i, j]= 第 i 行 j 列格子左上部分所有元素的和若将位于(x1, y1)和(x2, y2)将位于和之间的原序列都加上c规律:偶+奇-ps. 三维坐标(x,y,z)映射到一维的下标是。
2022-10-24 00:09:27 108
原创 蓝桥(杂题3)
你可以从中选出两个数 Ai 和Aj(i 不等于 j),然后将 Ai 和 Aj 一前一后拼成一个新的整数。注意交换 Ai 和 Aj 的顺序总是被视为 2 种拼法,即便是 Ai = Aj 时。因此本题就相当于求Ai和Aj 满足 (Ai + Aj * 10 ^ len(Ai)) % k = 0 这一等式(len(Ai)是Ai的位数)即首先枚举Ai,然后求有几个Aj * 10 ^ len(Ai) % k = -Ai % k。转化 (Aj * 10 ^ len(Ai)) %k = -Ai % k。
2022-10-22 13:13:43 527
原创 蓝桥(杂题2)
现在给出这 N 个整数,小明想知道包含这 N 个整数的最短的等差数列有几项?但是粗心的小明忘记了一部分的数列,只记得其中 N 个整数。__gcd( , ) 取最大公约数。数学老师给小明出了一道等差数列求和的题目。
2022-10-21 00:28:33 165
原创 蓝桥(杂题1)
思路: 取模转化 + 前缀和观察到有k倍 or 倍数关系的题目,尽量可以往取模分析来想。先维护一段前缀和,转化为, 两个取模相等的前缀和就能组成一个k倍区间。注意:取模为零的前缀和即可以单独满足条件(从0起)由 (sum[r] - sum[|-1])%k = 0推出 sum[r]%k = sum[|-1]%k。
2022-10-20 00:47:42 204
原创 Get Started with Intel VTune Profiler(summary)
表示可用逻辑处理器的“已用时间”和使用率级别,并提供在应用程序执行期间使用了多少个逻辑处理器的图形视图。:性能快照提供了其他分析类型,这些分析类型可能有助于更深入地调查应用程序中发现的性能问题。与在应用程序中检测到的性能问题相关的分析类型以。单独约束的事实表明,应用程序受频繁但很小的内存请求的约束,而不是受饱和的物理 DRAM 带宽的约束。提供了有关最耗时的函数(热点函数)的数据,这些数据按执行时所花费的 CPU 时间排序。运行热点分析以查找热点或对应用程序的总运行时间贡献最大的代码段。
2022-10-16 22:22:36 1210
原创 设计一个猜数游戏(C/S)
猜数游戏即计算机事先准备好一个目标数字,然后与我们键盘输入的数字相比较,返回结果为“大了”或者“小了”,直至“猜对了”为止。 服务器先利用随机数生成一个在指定区间范围的目标数字,客户端(用户)向服务器输入其所猜测的数字,服务器根据具体情况向客户端(用户)返回其猜测的数偏大还是偏小,并记录客户端(用户)猜测的次数,如此反复,直到客户端(用户)猜对为止。
2022-10-15 11:51:42 1102
原创 OpenMP-CODE
加大并行力度,尽量并行外层循环在外层循环上用parallel,内层用for,并同时注意同步forforfor 后可以用 nowait 取消结束的隐式同步。
2022-10-06 00:30:22 482
原创 工资总额分配方案
工资总额分配是与企业人力资源战略紧密联系的管理要素。建立一套科学、合理的工资总额分配方案,对国有企业而言至关重要。本文运用了灰色关联、标准回归系数、Spearman相关系数、逐步回归等分析方法,以某国有企业2020年26个省市分公司年运营的统计数据作为研究对象,综合考虑工资分配的影响因素,通过建立多元回归模型,实现了判断公司工资总额地域分配的合理性以及提出合理的分配方案。针对问题一,由附件一可知:影响各省份的分公司年运营因素主要分为地区差异、收入与成本规模、收益三大项。
2022-09-26 01:07:39 1775 1
原创 SYCL学习笔记
基于DPC++SYCL源自OpenCL技术,且运行模型类似。编写风格属于现代C++OpenMP5.0提供了许多与SYCL和dpc++相同的特性。
2022-07-19 11:24:37 4073 4
原创 数学建模 - K-means聚类
将样本划分为由类似的对象组成的多个类的过程(聚类)。聚类后,可以更加准确的在每个类中单独使用统计模型进行估计、分析或预测;也可以探究不同类之间的相关性和主要差异。(KMeans本质上是一种基于欧式距离度量的数据划分方法)ps.分类是已知类别的,聚类未知。...
2022-07-18 22:32:28 3089 1
原创 并行算法优化(1)
通常支持超线程的多核处理器能够使用的线程数最多是物理核心数的2倍X86 流加载/流存储:SSE中的 prefetch指令 可以实现软件预取技术提高多路系统中多核处理器之间通信的带宽。原理:访问存储器的速度与距离处理器的距离有关,为了满足分配的从“近端”起。线程亲和性gcc的环境变量:GOMP_CPU_AFFINITYLinux系统:numactl工具OpenMP、pthread性能分析工具:gprof :通过在编译时插入代码来分析程序nvprof :NVIDIA开发,用于运行在GPU上
2022-06-25 21:19:04 925
原创 数学建模 - FZU校赛B题(一)
赛题 B : “ 药食同源 ” 的物质基础中医自古以来就有“药食同源”(又称为“医食同源”)理论:许多食物既是食物也是药物,食物和药物一样能够防治疾病。“药食同源”的主要依据是:食物和药物同样具有四性(寒、凉、温、热),而药食的四性是中医药最重要的基本理论之一,是中医临床经验的总结,四性的物质基础一直是中医药基础研究的难点,尤其是定量研究方面。......
2022-06-12 23:23:34 964
原创 数学建模-线性回归
多元线性回归回归分析: 通过研究自变量X和因变量Y的相关关系,尝试去解释Y的形成机制,进而达到通过X去预测Y的目的。本次主要学习线性回归。(划分依据是因变量Y的类型)ps. 其他: 0-1回归,定序回归,计数回归,生存回归(一)基本概念关键词关键词: 相关性,Y,X相关性 != 因果性Y 是需要研究的核心变量(因变量)X是解释变量(自变量)回归分析的作用分析哪些X变量是同Y真的相关,哪些不是 (变量选择) -----采用 逐步回归法除去与Y不相关的X变量之后,需要分析这些重
2022-05-30 23:10:50 6232
原创 数学建模-拟合算法
拟合算法与插值算法的区别:拟合不需要曲线一定经过给定的点。拟合的目的在于 最小化损失函数(loss)步骤1. 散点图% 先将数据导入% matlabplot(x,y,'o')xlabel('x的值')ylabel('y的值')画出散点图,进行大致的观察2. 最小二乘法如何理解最小二乘法?核心表达式:matlab求解:clear;clcload % +.xlsx文件plot(x,y,'o')xlabel('x值')ylabel('y值')n = size(x,1)
2022-05-30 13:52:55 446
原创 cpu访存优化
内存引用void f1(const int *a, int n, int *ans){ // int sum = *ans; for (int i = 0; i < n; ++i) { *ans += a[i]; // remove // sum += a[i]; } *ans = sum;} // insteadvoid f2(const int *a, int n, int *ans){
2022-05-23 21:10:14 536 3
原创 Openmp (new)
#include <stdio.h>#include <omp.h>#define NUM_THREADS 4int main(int argc, char* argv[]){ int a[1000]={0}; /* omp_set_num_threads(4); #pragma omp parallel { printf("%d of %d threads\n", omp_get_thread_num(), omp_ge...
2022-05-13 19:56:59 149
原创 IPCC 2021-学习总结
题目IPCC2021-初赛赛题硬件环境:初始测试:Average: 17978 ms编译选项: -O3优化Baseline:Average: 3719 ms热点分析:由于函数较多,先进行热点分析,确定主要优化函数主要优化函数:SLIC::PerformSuperpixelSegmentation_VariableSandMSLIC::DoRGBtoLABConversion & SLIC::RGB2LAB & SLIC::RGB2XYZSLIC::Enforc
2022-04-17 19:03:33 935
原创 汇编(32位)总结2
框架N equ 100.data msg1 db 'YES',0 a dword 1,4,23,53,654,12,1,7,8,123 b dword 10 dup(?) len dword 9.code main proc exit main endp ;函数 end main读写;readstring.data expr db 128 dup(0),0.code lea edx,expr mov ecx,128 call readstring mo
2022-04-14 20:51:00 740
原创 Matlab总结
数组从1开始 (2016a)注解 %元胞数组 cell幻方magic 横竖斜之和都相等矩阵操作全一矩阵: ones(x,y)运算:ans = A * B‘ans = A .* B ---- 对应位置的数相乘ans = A / B — A乘B的逆ans = A \ B — 右边forif基本绘图二维:figure — 建立幕布用法:绘制 y = sin(x)三维:plot3(x,y,z)hold onhold..
2022-04-13 21:12:06 703
原创 汇编(32位)总结
;smmaryirvine32.inc byte dbword dwdword ddqword dqN equ 100arr byte/word/dword N dup(0)arr[i]: arr[4*reg32] ;dd;用字符串数组来表示字符串str1 db 'Hello World',0lea edx,str1call writestring.databuf db 100 dup(?).codelea edx,bufmov ecx,100
2022-04-09 15:08:26 276
原创 linux自带的热点分析
perfperf record -e cpu-clock -g ./runTo make the adjusted perf_event_paranoid setting permanent preserve it in /etc/sysctl.conf (e.g. kernel.perf_event_paranoid = )临时设置,需要sudo su切换到root用户后再进行如下操作,操作完成后返回原用户sudo suecho -1 > /proc/sys/kernel/perf_
2022-03-26 21:05:55 3002
原创 python 结构
列表创建一个普通列表x = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday']print(x, type(x))# ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday'] <class 'list'>利用range()创建列表x = list(range(10, 1, -2))print(x, type(x))# [10, 8, 6, 4, 2] <cl
2022-03-21 00:10:06 110
原创 python (与C的差别)
来源: AI训练营Python-阿里云1. 操作符#表示注释,作用于整行‘’’ ‘’’ 或者 “”" “”" 表示区间注释,在三引号之间的所有内容被注释// 整除(地板除)** 幂逻辑运算符:三元:x, y = 4, 5small = x if x < y else y其他:注意变量是否为可变类型is, is not 对比的是两个变量的内存地址==, != 对比的是两个变量的值2. 变量&属性ourTeacher = myTeacher + ',
2022-03-20 12:26:10 1429
原创 OpenMP
通过使用预处理指令来让程序并行化1#pragma omp 指令 [子句[子句]…]#include <stdio.h>#include <omp.h>int main(int argc, char* argv[]){ int i; // YOUR CODE HERE #pragma omp parallel for // END OF YOUR CODE for (i = 0; i < 10; i++) { printf("i = %d
2022-03-10 21:36:27 369
原创 TensorFlow GPU优化(1)
GPU 加速深度学习,剖析深度神经网络NVIDIA一nvidia-smi功耗是 GPU 利用率的另一个重要指标。通常,启动的 CUDA 或 Tensor 核心越多,消耗的 GPU 功率越高。GPU-Util显示利用率深度学习领域中提高 GPU 利用率最常使用的优化技术—几乎占用所有 GPU 内存的批次大小二nvidia-smi dmon以滚动方式列出更多的 GPU 统计数据每一个 GPU 都有多个串流多处理器(streaming multiprocessors),执行 CUDA 核心
2022-03-10 19:26:25 785
工资总额分配方案 - 数学建模论文
2022-09-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人