HPC
文章平均质量分 73
撞强
非专业,更专注
展开
-
lammps编译(2Aug2023、intel2020、rtx4070ti)
root@node101 gpu]# vi Makefile.linux ##修改。[root@node101 gpu]# make -f Makefile.linux ##编译GPU库。lammps支持单精度,也支持双精度。受限于4070Ti,其双精度能力很差,故本次使用单精度方式进行使用。4070Ti为安培架构,SM为86。双精度性能差,PRECISION为-D_SINGLE_SINGLE。原创 2023-12-13 12:37:02 · 1260 阅读 · 0 评论 -
wien2k报错:setrlimit(): WARNING: Cannot raise stack limit, continuing: Invalid argument
本次报错,受pbs_mom服务影响,虽在rc.local、limits.conf中解除了stack限制,但是在/etc/systemd/system/multi-user.target.wants/pbs_mom.service中进行了相关限制,导致作业调度执行过程中,应用程序受到该限制影响。6、/etc/systemd/system/引导级别(multi-user.target.wants)/下的文件(对应到服务或程序名)5、/etc/systemd/system/下的文件。3、firewall未关闭。原创 2023-10-18 00:12:24 · 259 阅读 · 0 评论 -
anaconda3常用命令及初始状态
3、进入某个(比如说base)环境:conda activate base。文件拷贝、复制、移动、同步后,特别需要注意软连接!2、初始化:conda init。原创 2023-05-22 22:15:36 · 2784 阅读 · 0 评论 -
Mellanox Quantum 8790开HDR100端口(SPLIT模式)
开启HDR100的SPLIT MODE原创 2023-03-27 17:59:55 · 1922 阅读 · 0 评论 -
sinfo: error: resolve_ctls_from_dns_srv: res_nsearch error: Host name lookup failure
slurm bug id:10066 url:https://bugs.schedmd.com/show_bug.cgi?id=10066原创 2021-06-11 23:55:24 · 4626 阅读 · 3 评论 -
Geant4基础安装
Geant4不做过多介绍。当转主流版本是geant4.10.06。1、检查环境:cmake≥3.8GCC >=4.9.3, >=5.4, >=6.3, >=7.3, >= 8.2, >= 9.2 64bitIntel C/C++ Compiler >=19.X. Note that the Intel Compiler must be ...原创 2020-01-21 22:06:45 · 826 阅读 · 0 评论 -
某HPC集群开关机维护操作
1、清除当前所有运行作业以及残留作业记录ssh node10/etc/init.d/pbs_server stop/etc/init.d/maui.d stopfor i in `seq 10 46`;do ssh node$i "hostname;/etc/init.d/pbs_mom stop";donerm -rf /opt/gridview/pbs/dispat原创 2015-09-06 11:38:49 · 1580 阅读 · 0 评论 -
cesm下载备注
新版使用svn下载。软件要求:The following are the external system and software requirements for installing and running CESM.UNIX style operating system such as CNL, AIX and Linux csh, sh, and per原创 2015-07-10 22:16:50 · 3006 阅读 · 7 评论 -
NCEP GFS数据规格表 2014.10.17
NCEP Products Inventoryvia HTTP or FTPhttp://www.ftp.ncep.noaa.gov/data/nccf/com/gfs/prodftp://ftp.ncep.noaa.gov/pub/data/nccf/com/gfs/prod http://www.nco.ncep.noaa.gov/pmb/products原创 2015-07-09 22:53:45 · 5258 阅读 · 0 评论 -
mkl相关介绍
intel mkl部分知识及常用编译参数说明原创 2015-05-02 21:24:07 · 2742 阅读 · 0 评论 -
MS快速提交作业方法
MS任务提交方法:编辑~/.bashrc文件,添加以下内容:alias RunCASTEP.sh='/public/software/accelrys/MaterialsStudio6.0/etc/CASTEP/bin/RunCASTEP.sh'alias RunDMol3.sh='/public/software/accelrys/MaterialsStudio6.0/etc/DMol3原创 2016-01-04 16:05:12 · 2109 阅读 · 0 评论 -
气象类部分软件和数据库编译参数
git-2.2.2./configure --prefix=/public/software/git/2.2.2jasper-1.900.1./configure --prefix=/public/software/jasper CC=icc CXX=icpc F77=ifort FC=iforthdf-4.2.9./configure --prefix原创 2015-03-23 13:54:27 · 1180 阅读 · 0 评论 -
64位与32位编程的数据类型区别
C/C++仅仅定义了这些基本数据类型之间的关系,并没有定义严格定义它们的字长。在不同的平台上,根据编译器不同的实现,它们的字长如下表所示:数据类型LP64ILP64LLP64ILP32LP32char888转载 2015-11-04 13:56:24 · 454 阅读 · 0 评论 -
Parastor200存储系统巡检
1、状态检查/home/parastor/bin/sysctl/parastor_monitor checkstatnodetype:MGR#nodeid:1#ha_status:mgsha_active#status:oknodetype:MGR#nodeid:2#ha_status:mgsha_standby#status:oknodetype:oStor#nodeid原创 2015-10-12 12:08:13 · 967 阅读 · 0 评论 -
HPC通过SSH连接时登录时间较长
原因:DNS解析失败。 解决方法1:配置DNS服务 解决方法2:在/etc/hosts中做固定解析 解决方法3:修改/etc/ssh/sshd_config将#UseDNS yes修改为UseDNS no。 另外,如果需要允许A用户访问B用户的家目录,或A用户可以对自己的家目录随意设置权限,可修改#StrictModes yes为Stric原创 2015-11-12 20:42:51 · 493 阅读 · 0 评论 -
NUMECA介绍
NUMECA 国际公司于1992 年,在国际著名叶轮机械气体动力学及CFD 专家,比利时王国科学院院士、布鲁塞尔自由大学流体力学系主任查尔斯-赫思(Charles HIRSCH)教授的倡导下成立。其核心软件是在该系80~90 年代为欧洲宇航局(ESA)编写的CFD 软件— 欧洲空气动力数值求解器(EURANUS)--的基础之上发展起来的。 NUMECA 国际公司一直致力于高度集成及用户化的转载 2016-02-18 22:57:07 · 3271 阅读 · 0 评论 -
infiniband带宽测试方法1 ib_read/write_bw/lat
一、带宽的测试。1、找任意两台服务器,先查看IB的状态。#ibstat2、两台服务器都要重启IB的服务# /etc/init.d/openibd restart3、两台服务器都要开户子网管理器#/etc/init.d/opensmd start暂停子网管理器的命令是# /etc/init.d/opensmd stop 4、第一台机执行 #ib_wri原创 2016-05-24 09:16:04 · 17432 阅读 · 5 评论 -
abinit 8.0.8b并行编译参数
./configure --prefix=/public/software/apps/abinit/8.0.8 --enable-mpi --enable-fast-check --with-mpi-prefix=/public/software/mpi/openmpi/2.0.0/intel --with-linalg-libs="-L/public/software/compiler/原创 2016-12-23 21:34:26 · 2153 阅读 · 0 评论 -
abinit自动安装脚本
1、首先将该版本需要的所有软件包down到本地,放到abinit源码所在文件夹下。2、完成intel编译器、mpi等基础环境的调试。3、 #!/bin/bashecho -en '\e[31m The script writed by xtao! \e[0m \n'echo -en '\e[31m Power by xtao ! \e[0m \n'echo 'Now c原创 2012-10-28 17:26:21 · 1489 阅读 · 0 评论 -
气象业务系统切换国际标准时间
cp /usr/share/zoneinfo/GMT /etc/localtime原创 2015-03-12 18:51:06 · 612 阅读 · 0 评论 -
torque设置普通用户只能看自己的作业
qmgr -c "set server query_other_jobs = false"原创 2015-03-18 01:03:49 · 1074 阅读 · 0 评论 -
rhel6通过命令关闭防火墙并清除规则
chkconfig iptables offchkconfig ip6tables off/etc/init.d/iptables stop/etc/init.d/ip6tables stop cat /etc/sysconfig/system-config-firewall --disabledEOFcat /etc/sysconfig/iptables原创 2013-01-08 19:00:22 · 1497 阅读 · 0 评论 -
HPC软件调试列表
原创 2012-10-28 17:40:57 · 666 阅读 · 0 评论 -
mvapich2 INTEL编译器优化下编译参数
./configure--with-device=ch3:nemesis --prefix=.... CC=icc CXX=icpc F77=ifort F90=ifort configure后 make -j 8 && make install 即可将程序安装到prefix指定的目录下。 然后写一个shell文件来申明变量环境。 如果需要系统登录自动申明变原创 2012-10-28 17:16:28 · 1711 阅读 · 0 评论 -
ks.cfg使用于HPC和ORACLE单机,系统版本:RHEL6.2,硬件平台:X86全系列
由于AMD 6200系列和INTEL E5系列等新架构CPU的大量推广,传统的SUSE10和RHEL5在新的硬件平台上已经不能发挥出良好的性能。 经大量测试发现,在RHEL6.2 x64平台上,infiniband网络和计算软件能得到最佳性能。 由于RHEL6.2 x64在系统安装时有很多32位软件包被自动忽略,同时使用UUID方式挂载硬盘不方便克隆和修复。现发布一个新测试通过的k原创 2012-11-02 18:41:20 · 2267 阅读 · 0 评论 -
Materials Studio增加torque调度模块(MS作业调度)
该文档使用于ms5.5及ms6.0 。解压出的文件无需修改,直接使用就行。 记得进MS网关修改调度设置。 修改网关后记得重启网关服务。 MS网关密码:gatekeeper Supported Queuing Systems in Materials Studio 5.5The supported queuing systems in Materials Stud原创 2012-10-28 17:29:48 · 3129 阅读 · 0 评论 -
libibverbs: Warning: RLIMIT_MEMLOCK is 32768 bytes.错误修复
#!/bin/bashcat /etc/security/limit.conf* hard core unlimited* soft core unlimited* hard nproc unlimited* soft nproc unlimited* hard memlo原创 2012-10-28 17:13:11 · 2114 阅读 · 0 评论 -
DoCon标准安装文档
1. 软件介绍DoConis--------a Computer Algebra program written in a purely functional, non-strict language Haskell. Itjoins the categorial approach to the mathematical computation express原创 2012-10-07 20:43:23 · 587 阅读 · 0 评论 -
lustre 2.2 for rhel6.2 x64 install guid
wget http://downloads.whamcloud.com/public/lustre/lustre-2.2.0/el6/server/x86_64/kernel-devel-2.6.32-220.4.2.el6_lustre.x86_64.rpmwget http://downloads.whamcloud.com/public/lustre/lustre-2.2.0/e原创 2013-01-17 22:36:59 · 1726 阅读 · 0 评论 -
How to build NCL and NCAR Graphics from source code
NCAR CISL VETS Download Contributors Citing NCL NCL Examples Functions Resources Popular Links What's New Support External advancedNCL > Download H原创 2013-06-11 10:35:47 · 3109 阅读 · 0 评论 -
cairo编译 1.14.2
./configure --prefix=/public/software/mathlib/cairo-1.14.2 --enable-svg=no png_CFLAGS=-I/public/software/mathlib/libpng-1.2.53/include png_LIBS="-L/public/software/mathlib/libpng-1.2.53/lib -lpng" pix原创 2015-03-17 10:28:38 · 713 阅读 · 0 评论 -
Infiniband驱动安装-RHEL5.8
Infiniband驱动安装。Linux平台原创 2015-03-08 23:30:51 · 2449 阅读 · 0 评论 -
CFLAGS、CXXFLAGS、LDFLAGS与LIBS
CFLAGS 表示用于 C 编译器的选项,CXXFLAGS 表示用于 C++ 编译器的选项。这两个变量实际上涵盖了编译和汇编两个步骤。CFLAGS: 指定头文件(.h文件)的路径,如:CFLAGS=-I/usr/include -I/path/include。同样地,安装一个包时会在安装路径下建立一个include目录,当安装过程中出现问题时,试着把以前安装的包的include目录加入转载 2015-03-16 23:20:09 · 498 阅读 · 0 评论 -
HPC集群公网开放安全加固和资源显示
1 登录强制修改密码[root@node24 ~]# cat /etc/passwd | tail -31 | awk -F":" '{print $1}' >> user[root@node24 ~]# for i in `cat user`;do chage -d 0 $i ;done 2 设置密码复杂度[root@node24 ~]# cat /e原创 2015-01-18 22:13:35 · 1127 阅读 · 0 评论 -
ipmitool开关机脚本
新建1个755权限的SH脚本。 写入如下内容: ipmitool -H 10.10.20.$1 -l lan -U admin -P admin power $2原创 2014-11-20 13:38:26 · 1670 阅读 · 0 评论 -
vmware启动xorg失败排错!K1 K2卡
主要解决多张K1卡部署3D虚拟时xorg无法启动SB 威睿公司原创 2013-11-11 00:12:43 · 7590 阅读 · 0 评论 -
EDAC检查内存错误
开启EDAC服务或加载EDAC内核模块后: [root@node10 ssh]#grep"[0-9]" /sys/devices/system/edac/mc/mc*/csrow*/ch*_ce_count /sys/devices/system/edac/mc/mc0/csrow2/ch0_ce_count:42457/sys/devices/system/edac/mc/m原创 2013-06-11 10:41:45 · 6992 阅读 · 4 评论 -
rhel卸载订阅
This system ismissing one or more valid entitlement certificates. Please runsubscription-manager for more information 把证书订阅模块删除掉即可,按以下步骤执行即可: 方法一:yum remove subscription* -yyum remove piru原创 2013-06-11 10:38:48 · 1346 阅读 · 0 评论 -
通过PAM限制普通用户绕过torque提交任务到计算节点
在川大物理学院实施集群时,发现部分用户绕过torque,从管理节点上通过SSH登陆到计算节点,直接运行程序,占用系统资源的现象。该现象严重影响了集群的正常运行。本文提供两个方法来应对这个现象。 方法一:实现效果:当用户A在计算节点node1上有作业(由torque+maui.d分配的PBS任务)时,可以SSH到node1。当A在node1上无作业时,无法SSH登陆到node1。原创 2012-10-07 20:49:01 · 2815 阅读 · 0 评论