-
登录阿里云服务器https://ecs.console.aliyun.com/
-
创建两个实例,分别命名为node0,node1
-
待实例创建成功后,点击进入实例详情,点击“远程连接"
-
输入账号密码,登陆后进入服务器
-
尝试在第一台机器上登陆了第二台机器:
-
使用ssh-keygen -t rsa命令 在node0上生成了公钥,保存到了文件/root/.ssh/id_rsa.pub中:(中途遇见停顿直接按回车)
使用ssh-copy-id 将公钥复制到node1中:
尝试登录node1,不再需要密码
-
编辑主机映射 vi /etc/hosts
将映射文件拷贝到node1中:
能够直接通过名字登录node1啦!
第二次登录就不需要yes了
-
给两台机器分别安装mpich包
-
将mpi程序从本地放入阿里云
参考:https://blog.csdn.net/weixin_41010198/article/details/81162719
配置服务器端:
apt-get install openssh-server
修改ssh配置文件:
先使用”#”注释掉PermitRootLogin without-password
添加一行 PermitRootLogin yes
然后:
配置本地客户端:有windows和linux两种方式,本人选择了linux
打开xshell5软件,点击左上角的新建,选择协议,输入主机号,端口号,点确定
点击生成的连接,点确定
输入阿里云主机上的用户名和密码即可连接
就通过xshell访问云服务器啦
输入sudo apt-get install lrzsz
安装成功之后,输入rz,弹出一个对话框,传送文件
这时候目录里就有pi.c文件了
-
在服务器端单机编译运行mpi文件
-
修改mpi文件,是其能显示是在哪个主机上运行的
主要改这几行:
-
设置文件名为mpi_pi.c,将文件重新上传到服务器端并运行:
-
设置mpiserver文件,指定结点的进程数目
-
分发编译好的main文件到集群的每一个结点的相同文件夹下:
-
多机执行:
-
过程中遇到的问题:
置好了之后单机能够运行mpi程序但是并发执行报错:floating point exception
解决方法:在阿里云中“更多“->“磁盘和镜像”->“更换操作系统” 更换操作系统后重新搭一次。
基于阿里云建立包含两个结点的linux并行计算集群
最新推荐文章于 2022-09-28 21:31:16 发布