临毕业前,想把NMF算法基于MPI实现,申请了16台4核心的机器作为实验环境,利用mpich进行集群的搭建,步骤记录如下:
安装mpich
1. 下载之后,mv mpich.tgz /home/
2. tar zxvf mpich.tgz
3. ./configure -rsh=ssh -prefix=/usr/local/mpich
4. make&&make install
配置mpich 的工作目录
1. 每一个slave 节点都进行如上安装 /home/mpich 目录为以后任务分发的默认目录
2. chown -R username:username mpich
chown -R username:username /usr/local/mpich
3. 在~/.bashrc 里面添加
export PATH=$PATH:/usr/local/mpich
配置修改
1. 修改/usr/local/mpich/share/machines.LINUX,前面是机器的别名,后面是机器的cpu核心数
ict-master:4
ict-49:4
ict-47:4
ict-46:4
ict-45:4
ict-44:4
ict-43:4
修改/etc/hosts 配置如下
127.0.0.1 localhost.localdomain localhost
xx.xxx.xx.xx ict-master
xx.xx.xx.xx ict-49