Hadoop分布式环境部署

最新推荐文章于 2024-09-19 23:25:57 发布

hrk001

最新推荐文章于 2024-09-19 23:25:57 发布

阅读量1.1k

点赞数

分类专栏： Java 文章标签： hadoop 服务器 ssh java 远程登录分布式计算

本文链接：https://blog.csdn.net/hrk001/article/details/4447597

版权

Java 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

Hadoop


分布式环境部署

目标

配置一个分布式计算集群，让hadoop 框架能够正常的运行起来，主要有master 的namenode,jobtracker 和slave 的datanode,tasktracker. 便于之后进行分布式运算。由于作者水平有限，疏漏指出希望批评指正。

环境

两台（或多台）服务器，都是用linux 系统，都安装了jdk1.5 以上版本，都安装了ssh ，各个机器名不一致。

实施

1 建立同名用户

原因

hadoop 运行时需要使用相同的目录进行存储，而且master 要方便的管理每台服务器需要一个同名用户的ssh 公钥。

步骤

(1) su root

(2) 输入root 密码

(3) adduser username （用户名）

除了输入新用户的密码，一路回车即可

创建用户的时候会在/home/ 下自动给用户创建一个默认目录，之后存放数据和hadoop 程序就使用该目录即可

如果发现自己建用户错了，使用sudo userdel username 即可删除刚才建立的用户

2 配置ssh

原因

因为整个hadoop 在数据交换的时候都使用了ssh 服务，所以首先要配置ssh ，让各个节点服务器都能互通，为此，需要给每台服务器生成一个公钥用于登录认证。

步骤

在每台服务器：

(1) 进入用户默认目录，如zoomsun 用户的默认目录是/home/zoomsun ：cd /home/zoomsun

(2) 建立.ssh 文件夹：mkdir .ssh

(3) 进入.ssh 目录：cd .ssh

(4) 创建当前用户的ssh 登录公钥：ssh-keygen -t rsa ，建议别使用sudo 创建，一路回车即可，这时候会在当前目录( 如/home/zoomsun/.ssh/) 生出id_rsa.pub ，即rsa 公钥

(5) 使用scp 命令把生成的公钥传给别的服务器，并保存成不同的名字，如我在192.168.1.118 的主机传给192.168.1.109 ，并且保存为118_id_rsa.pub 的时候命令如下：scp id_rsa.pub zoomsun@192.168.1.109:/home/zoomsun/.ssh/118_id_rsa.pub

(6) 登录192.168.1.109 ，可以远程登录：ssh zoomsun@192.168.1.109 -p22( 是22 端口的时候可以不写)

(7) 进入当前用户默认目录下的.ssh 目录:cd ~/.ssh

(8) 把公钥内容添加到登录认证文件中：cat 118_id_rsa.pub >> authorized_keys

(9) 登录到192.168.1.118 主机，使用ssh zoomsun@192.168.1.109 进行连接109 主机，这时候会出现输入yes/no? 的提示，输入yes 。（配置完成后第一次登录时许需要给know_hosts 添加东西，所以会有这个确认，以后再登录就不用输入yes 了）

(10) 好了，在不同的机器上重复上面的步骤，让所有的服务器互通吧！