首先参考
文章:http://blog.sciencenet.cn/blog-211012-593362.html
以及:http://bbs.csdn.net/topics/260015576http://blog.sciencenet.cn/blog-548663-796287.html
建议:现在最新版本的intel编译器parallel studio包含mpi库,BLAS、LAPACK以及FFT3D,在Intel的机器上,建议统一使用INTLE自家的算法库,这样可以保证速度不至于出问题。
第一篇文章里提到的,vasp安装的前提条件
1、vasp源码包
vasp.5.2.tar.gz ## vasp 源代码
vasp.5.lib.tar.gz ## vasp提供的lapack
2、编译器
比如: Intel fortran 11.1(带MKL库)
3、blas库
Intel 编译器带有,也可以使用GotoBLAS2(http://www.tacc.utexas.edu/tacc-projects/gotoblas2/downloads)
gotoblas2库编译:
#tar -xvzf GotoBLAS2-1.13.tar.gz
#cd GotoBLAS2
#make TARGET=NEHALEM (可以选择make CC=icc FC=ifort BINARY=64 TARGET=NEHALEM)
成功会有提示:GotoBlas build complete
于是得到了libgoto2_nehalemp-r1.13.a这个文件,在makefile里面相应的写法是BLAS= (路径)/GotoBLAS2/libgoto2_nehalemp-r1.13.a
4、lapack库
Intel 编译器带有,也可以使用vasp提供的lapack
5、mpi
可以使用openmpi,也可以使用mpich2(安装请百度,或者查看官方网站)
http://www.open-mpi.org/
http://phase.hpcc.jp/mirrors/mpi/mpich2/
6、FFTW (vasp代码自带有,优化选项是可选的)
Intel 编译器带有,但是需要自己编译,可以使用FFTW 3.2.2 (http://www.fftw.org/)
FFTW lapack-3.5.0编译
#tar -xvzf lapack-3.5.0.tgz
#cd lapack-3.5.0
#mkdir (安装目录)
#./configure --prefix=(安装目录)
#make
#make install
于是在(安装目录)里面有lib、include等文件夹,其中lib包含的libfftw3.a以及include里面的头文件是需要被调用的,相应的makefile的写法
FFT3D = fftmpi.o fftmpi_map.o fftw3d.o fft3dlib.o (安装目录)/lib/libfftw3.a
以及
FFLAGS = -I(安装目录)/include/ -FR -lowercase -assume byterecl
-------------------------------------------------------------------------------------------------------------------下面记录我的编译过程
编译环境:centos 6.0,Intel fortran/c++ compoler 11.1 with mkl,mpich2(build with intel)
1、编译vasp提供的lapack
#tar -xvzf vasp.5.lib.tar.gz
#cd vasp.5.lib
#cp makefile.linux_ifc_P4 makefile
修改makefile里面的FC=ifort
#make
2、编译Intel自带的FFTW
#cd /opt/intel/Compiler/11.1/075/mkl/interfaces/fftw3xf 这个目录根据实际情况修改
#make libem64t F=intel precision=MKL_DOUBLE 于是产生了libfftw3xf_intel.a
3、编译vasp
#tar -xvzf vasp.5.2.tar.gz
#cd vasp.5.2
#cp makefile.linux_ifc_P4 makefile
然后修改makefile里面的内容
-----------------------------------
FC=/opt/mpich2-intel-11/bin/mpif90
##FC是编译器路径,如果需要并行,那么就选择相应mpi的路径,串行FC=ifort就行
BLAS= -L/opt/intel/Compiler/11.1/075/mkl/lib/em64t -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lguide -lpthread
##使用Intel的blas库,注意前面的-L,每一个参数表示指定目录下有一个相应的.a/.so文件
LAPACK= ../vasp.5.lib/lapack_double.o
##使用vasp自带的lapack,注意要先编译好(../vasp.5.lib/lapack_double.o这个文件存在)
##如果使用Intel的lapack则
LAPAC= -L/opt/intel/Compiler/11.1/075/mkl/lib/em64t -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lguide -lpthread
CPP = $(CPP_) -DMPI -DHOST=\"LinuxIFC\" -DIFC \
-Dkind8 -DCACHE_SIZE=4000 -DPGF90 -Davoidalloc -DNGZhalf \
-DMPI_BLOCK=8000
##这个是并行的CPP 参数形式
LIB = -L../vasp.5.lib -ldmy \
../vasp.5.lib/linpack_double.o $(LAPACK) \
$(SCA) $(BLAS)
##这个我没动
FFT3D = fftmpi.o fftmpi_map.o fft3dfurth.o fft3dlib.o /opt/intel/Compiler/11.1/075/mkl/interfaces/fftw3xf/libfftw3xf_intel.a
##并行需要的FFT3D注意后面那个文件是要提前编译好的,如果不使用这个文件,可以将其注销
--------------------------------------------------------------------------------------
对于串行程序,基本上只要修改FC和BLAS的路径就行了。
运行vasp的时候要在环境变量里面添加mkl以及mpi的路径,比如在.bashrc里添加
PATH=/opt/intel/Compiler/11.1/075/bin/intel64:/opt/openmpi-intel11/bin/:$PATH
LD_LIBRARY_PATH=/opt/intel/Compiler/11.1/075/lib/intel64:/opt/intel/Compiler/11.1/075/mkl/lib/intel64:/opt/openmpi-intel11/lib/:$LD_LIBRARY_PATH
总结:随着对编译的了解,会慢慢熟悉这个文件的内容,平时参考的各种人的笔记由于版本和环境等问题,可能无法在自己的环境里正确工作,结合实际情况和参考官方档案在这个时候是可以多做做的。
顺便提一下NEB的编译
首先到官方网站下载:http://theory.cm.utexas.edu/vasp/downloads/
并按照官网的提示修改main.f以及makefile,以及要将源代码文件拷贝到vasp编译目录(注意每次make clean后这些文件就被删除了,要重新拷贝),还有需要注意的是不要弄错版本。
----vasp 运行段错误问题
在FLAG的选项中加入: -heap-arrays 64 试试看
---- 找不到库文件,但是这个库文件能locate到
在/etc/ld.conf 或者 /etc/ld.conf.d/xx.conf里面添加库路径,然后 sudo ldconfig
---- mpirun 需要启动mpd,在用户家目录建立一个.mpd.conf,然后mpd --daemon
---- Intel 编译器 2014 (13.n)的问题,貌似没有带mpi的某些函数,解决办法是安装2013(12.n)或者是安装2015
----相关优化问题,待研究。。。。
#############贴上一个并行版本的vasp编译文件#############
.SUFFIXES: .inc .f .f90 .F
SUFFIX=.f90
CPP_ = ./preprocess <$*.F | /usr/bin/cpp -P -C -traditional >$*$(SUFFIX)
FFLAGS = -I/share/apps/fftw/include -FR -assume byterecl -heap-arrays 64
OFLAG=-O3
OFLAG_HIGH = $(OFLAG)
OBJ_HIGH =
OBJ_NOOPT =
DEBUG = -FR -O0
INLINE = $(OFLAG)
LIB = -L../vasp.5.lib -ldmy \
../vasp.5.lib/linpack_double.o $(LAPACK) \
$(BLAS)
LINK =
FC=mpif77
CPP = $(CPP_) -DMPI -DHOST=\"LinuxIFC\" -DIFC \
-Dkind8 -DCACHE_SIZE=4000 -DPGF90 -Davoidalloc -DNGZhalf \
-DMPI_BLOCK=8000
MKLPATH=/share/apps/intel/composer_xe_2015.1.133/mkl/lib/intel64
LAPACK=
BLAS= -L$(MKLPATH) -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lpthread
SCA=
LIB = -L../vasp.5.lib -ldmy \
../vasp.5.lib/linpack_double.o $(LAPACK) \
$(SCA) $(BLAS)
FFT3D = fftmpi.o fftmpi_map.o fftw3d.o fft3dlib.o /share/apps/fftw/lib/libfftw3.a
BASIC= symmetry.o symlib.o lattlib.o random.o
SOURCE= base.o mpi.o smart_allocate.o xml.o \
constant.o jacobi.o main_mpi.o scala.o \
asa.o lattice.o poscar.o ini.o xclib.o xclib_grad.o \
radial.o pseudo.o mgrid.o gridq.o ebs.o \
mkpoints.o wave.o wave_mpi.o wave_high.o \
$(BASIC) nonl.o nonlr.o nonl_high.o dfast.o choleski2.o \
mix.o hamil.o xcgrad.o xcspin.o potex1.o potex2.o \
metagga.o constrmag.o cl_shift.o relativistic.o LDApU.o \
paw_base.o egrad.o pawsym.o pawfock.o pawlhf.o paw.o \
mkpoints_full.o charge.o dipol.o pot.o \
dos.o elf.o tet.o tetweight.o hamil_rot.o \
steep.o chain.o dyna.o sphpro.o us.o core_rel.o \
aedens.o wavpre.o wavpre_noio.o broyden.o \
dynbr.o rmm-diis.o reader.o writer.o tutor.o xml_writer.o \
brent.o stufak.o fileio.o opergrid.o stepver.o \
chgloc.o fast_aug.o fock.o mkpoints_change.o sym_grad.o \
mymath.o internals.o dimer_heyden.o dvvtrajectory.o vdwforcefield.o \
hamil_high.o nmr.o force.o \
pead.o subrot.o subrot_scf.o pwlhf.o gw_model.o optreal.o davidson.o \
electron.o rot.o electron_all.o shm.o pardens.o paircorrection.o \
optics.o constr_cell_relax.o stm.o finite_diff.o elpol.o \
hamil_lr.o rmm-diis_lr.o subrot_cluster.o subrot_lr.o \
lr_helper.o hamil_lrf.o elinear_response.o ilinear_response.o \
linear_optics.o linear_response.o \
setlocalpp.o wannier.o electron_OEP.o electron_lhf.o twoelectron4o.o \
ratpol.o screened_2e.o wave_cacher.o chi_base.o wpot.o local_field.o \
ump2.o bse.o acfdt.o chi.o sydmat.o
INC=
vasp: $(SOURCE) $(FFT3D) $(INC) main.o
rm -f vasp
$(FCL) -o vasp main.o $(SOURCE) $(FFT3D) $(LIB) $(LINK)
makeparam: $(SOURCE) $(FFT3D) makeparam.o main.F $(INC)
$(FCL) -o makeparam $(LINK) makeparam.o $(SOURCE) $(FFT3D) $(LIB)
zgemmtest: zgemmtest.o base.o random.o $(INC)
$(FCL) -o zgemmtest $(LINK) zgemmtest.o random.o base.o $(LIB)
dgemmtest: dgemmtest.o base.o random.o $(INC)
$(FCL) -o dgemmtest $(LINK) dgemmtest.o random.o base.o $(LIB)
ffttest: base.o smart_allocate.o mpi.o mgrid.o random.o ffttest.o $(FFT3D) $(INC)
$(FCL) -o ffttest $(LINK) ffttest.o mpi.o mgrid.o random.o smart_allocate.o base.o $(FFT3D) $(LIB)
kpoints: $(SOURCE) $(FFT3D) makekpoints.o main.F $(INC)
$(FCL) -o kpoints $(LINK) makekpoints.o $(SOURCE) $(FFT3D) $(LIB)
clean:
-rm -f *.g *.f *.o *.L *.mod ; touch *.F
main.o: main$(SUFFIX)
$(FC) $(FFLAGS)$(DEBUG) $(INCS) -c main$(SUFFIX)
xcgrad.o: xcgrad$(SUFFIX)
$(FC) $(FFLAGS) $(INLINE) $(INCS) -c xcgrad$(SUFFIX)
xcspin.o: xcspin$(SUFFIX)
$(FC) $(FFLAGS) $(INLINE) $(INCS) -c xcspin$(SUFFIX)
makeparam.o: makeparam$(SUFFIX)
$(FC) $(FFLAGS)$(DEBUG) $(INCS) -c makeparam$(SUFFIX)
makeparam$(SUFFIX): makeparam.F main.F
base.o: base.inc base.F
mgrid.o: mgrid.inc mgrid.F
constant.o: constant.inc constant.F
lattice.o: lattice.inc lattice.F
setex.o: setexm.inc setex.F
pseudo.o: pseudo.inc pseudo.F
poscar.o: poscar.inc poscar.F
mkpoints.o: mkpoints.inc mkpoints.F
wave.o: wave.inc wave.F
nonl.o: nonl.inc nonl.F
nonlr.o: nonlr.inc nonlr.F
$(OBJ_HIGH):
$(CPP)
$(FC) $(FFLAGS) $(OFLAG_HIGH) $(INCS) -c $*$(SUFFIX)
$(OBJ_NOOPT):
$(CPP)
$(FC) $(FFLAGS) $(INCS) -c $*$(SUFFIX)
fft3dlib_f77.o: fft3dlib_f77.F
$(CPP)
$(F77) $(FFLAGS_F77) -c $*$(SUFFIX)
.F.o:
$(CPP)
$(FC) $(FFLAGS) $(OFLAG) $(INCS) -c $*$(SUFFIX)
.F$(SUFFIX):
$(CPP)
$(SUFFIX).o:
$(FC) $(FFLAGS) $(OFLAG) $(INCS) -c $*$(SUFFIX)
fft3dlib.o : fft3dlib.F
$(CPP)
$(FC) -FR -O2 -c $*$(SUFFIX)
fft3dfurth.o : fft3dfurth.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
radial.o : radial.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
symlib.o : symlib.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
symmetry.o : symmetry.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
wave_mpi.o : wave_mpi.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
wave.o : wave.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
dynbr.o : dynbr.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
asa.o : asa.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
broyden.o : broyden.F
$(CPP)
$(FC) -FR -O2 -c $*$(SUFFIX)
us.o : us.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
LDApU.o : LDApU.F
$(CPP)
$(FC) -FR -O2 -c $*$(SUFFIX)