负责学校高性能计算平台,还在用盗版软件,前些天安装Material Studio4.4总是并行不了,前天朋友给了个5.0版本,安装试试。参考MaterialStudio v4.3安装手册
1.用普通帐户安装
ye@ ./Install –t cluster
复制你的license文件到/../Accelrys/License_Pack/licenses
2.修改
~/Accelrys/MaterialsStudio50/share/data下的machines.LINUX,写上各节点的机器名:CPU数。修改~/Accelrys/MaterialsStudio50/etc/Gateway/root_default/dsd/conf里两个文件里的CPU数为你各节点CPU总数。
否则在客户机上的job_control中只能看到安装节点上的cpu
3.启动网关,进入~/Accelrys/MaterialsStudio50/etc/Gateway,执行
./msgateway_control_18888 start
使用root账号进行配置: 使gateway自启动:
#cp /../Accelrys/MaterialsStudio42/Gateway/msgateway_control_18888 /etc/rc.d/init.d
#cd /../Accelrys/MaterialsStudio42/Gateway/
#/sbin/chkconfig --add msgateway_control_18888
发现一些问题:
1.用4.4的license也能启动5.0,由于先安装了4.4,不知怎么卸载,重新安装5.0,license用的是一个文件夹~/Accelrys/LicensePack/,直接就启动了。
2.Gateway start failed - process 6194 is not running.
装的时候不要用root帐户,用自己的帐户,并且装在自己的主目录里,再启动就不会有问题了。
3.现在只用castep,要把~/Accelrys/MaterialsStudio50/etc/Gateway/root_default/dsd/servers/Castep.pl权限修改可读。
简单试验时环境:
有 .cell和.param文件
PBS脚本
ye@node1:~/test/ms> cat run.pbs
#!/bin/sh
#PBS -N castepjob
#PBS -l nodes=2:ppn=4
#PBS -q low
cd ~/test/ms
RunCASTEP.sh TiCl3-alpha
ye@node1:~/test/ms> cat RunCASTEP.sh
#!/bin/sh
MS_INSTALL_ROOT=/public/home/ye/Accelrys/MaterialsStudio50
export MS_INSTALL_ROOT
server=Castep
$MS_INSTALL_ROOT/share/bin/runMSserver.sh $server $*
if [ $? != 6 ]; then
exit $?
fi
cat $MS_INSTALL_ROOT/etc/CASTEP/bin/RunCASTEP.Readme
安装完Material Studio 5.0后一直在试验PBS脚本的编写,参考了网上普遍的脚本,根据自身情况试验几个可用的。
1.首先是配置环境变量,.bashrc的内容如下:
# User specific aliases and functions
# Parallel Environment Setting for Materials Studio 5.0
export MS_INSTALL_ROOT=/public/home/ye/Accelrys/MaterialsStudio50
export DMOL3_DATA=$MS_INSTALL_ROOT/share/Resources/Quantum/DMol3
export DMOL_TMP=~/scratch
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/public/home/ye/Accelrys/LicensePack/linux/lib
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$MS_INSTALL_ROOT/lib
export TMPDIR=$DMOL_TMP
export PATH=$PATH:$MS_INSTALL_ROOT/etc/CASTEP/bin
. ~/Accelrys/LicensePack/etc/lp_profile
eval `$MS_INSTALL_ROOT/share/license/data/lic_setup.sh $MS_INSTALL_ROOT/ -s sh`
############################################
2.我试验的模型工程名称为TiCl3-alpha,有输入文件TiCl3-alpha.param和TiCl3-alpha.cell,执行完成之后出现TiCl3-alpha.castep等文件。
脚本1
#!/bin/sh
#PBS -N castep-job
#PBS -l nodes=2:ppn=4
#PBS -q low
cd ~/test/ms
mpirun -np 8 -prot -ibv -cpu_bind=v $MS_INSTALL_ROOT/bin/castepexe_mpi.exe TiCl3-alpha
#RunCASTEP.sh TiCl3-alpha
############################################
脚本2
#PBS -N TiCl3-alpha
#PBS -l nodes=2:ppn=4
#PBS -q low
ulimit -l unlimited
ulimit -s unlimited
project_name=TiCl3-alpha
cd $PBS_O_WORKDIR
rm .machine
rm APPFILE
rm $project_name.castep
NSLOTS=`cat ${PBS_NODEFILE} | wc -l`
$MS_INSTALL_ROOT/share/bin/create_appfile.sh -np $NSLOTS -list $PBS_NODEFILE -command "$MS_INSTALL_ROOT/bin/castepexe_mpi.exe $project_name"
/opt/hpmpi/bin/mpirun -e MPI_REMSH=/usr/bin/ssh -cpu_bind=v -prot -f ./APPFILE
#$MPI_ROOT/bin/mpirun -f ./APPFILE
############################################
脚本3
#PBS -N TiCl3-alpha
#PBS -l nodes=2:ppn=8
#PBS -q low
project_name=TiCl3-alpha
cd $PBS_O_WORKDIR
#cd ~/test/ms
rm .machine
for NODE in `cat $PBS_NODEFILE`
do
echo "-h $NODE -np 1 -e MPI_WORKDIR=$PBS_O_WORKDIR /
$MS_INSTALL_ROOT/bin/castepexe_mpi.exe $project_name" >> .machine
done
$MS_INSTALL_ROOT/hpmpi/opt/hpmpi/bin/mpirun -f .machine
############################################