分布式集群搭建

最新推荐文章于 2024-09-14 09:30:00 发布

momo_zhong

最新推荐文章于 2024-09-14 09:30:00 发布

阅读量500

点赞数

本文链接：https://blog.csdn.net/zhiman_zhong/article/details/83276113

版权

本文详细介绍了在CentOS环境下搭建Hadoop集群的过程，包括环境准备、网络配置、无密码公钥配置、主机名与IP映射、文件夹创建、环境变量设置、Hadoop配置文件修改、格式化NameNode及启动Hadoop等关键步骤。

摘要由CSDN通过智能技术生成

在B站找的搭建Hadoop的视频，以下是步骤

感觉很简练，有一篇博客讲的更加详细

1.准备好jar包和Hadoop包

兼容情况如下：

hadoop版本>=2.7：要求Java 7(openjdk/oracle)

hadoop版本<=2.6：要求Java 6(openjdk/oracle)

2.上传jar包以及配置环境变量

我的在安装系统时勾选了安装java，通过java -version直接看到1.7.0_45，似乎可以省略这一步

后面发现还是不能省，上传到/usr/local解压之后，在/etc/profile里修改环境变量

在最后面加上两行

export JAVA_HOME=/usr/local/jdk1.8.0_191

export PATH=$PATH:$JAVA_HOME/bin

3.上传Hadoop包并解压

我找同学拷的2.9.1版本，用rz上传到/usr/local/hadoop文件夹然后tar -xzvf

在centos下使用rz 首先要通过yum安装

网络连接问题

据说这个是因为虚拟机没有连上外网，解决中。

看了无数个虚拟机网络配置的博客，眼花缭乱，还是找不到解决的路子。

终于通过一个博客用ifconfig看了下，发现没有网卡eth0，参照https://www.imooc.com/qadetail/59155，发现我的eth0中没有IP地址，当执行service network restart会报错fail，猜测可能是dhcp没有自动为她分配，参考他的分配区间192.168.138.128-192.168.138.255之间，用ifconfig eth0 192.168.138.128手动配置了eth0的IP地址，再service network restart就成功联网了！

但是rz下载之后执行，报错waiting to receive...网上说因为没有端到端，所以跳不出图形界面

所以我用bitvise连接虚拟机，ip为刚才设置的，端口号22

4.创建无密码的公钥

原理：NameNode是通过SSH（Secure Shell）来启动和停止各个DataNode上的各种守护进程的。这就必须在节点之间执行指令的时候是不需要输入密码的形式，故我们需要配置SSH运用无密码公钥认证的形式，这样NameNode使用SSH无密码登录并启动DataName进程，同样原理，DataNode上也能使用SSH无密码登录到NameNode。

操作如下：

ssh-keygen -t dsa -P ' ' -f ~/.ssh/id_dsa

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

测试：ssh localhost

第一次询问要输入yes，下一次就可以直接输出了

（1）注意：master无密码登录本机已经设置完毕，接下来的事儿是把公钥复制所有的Slave机器上，用scp命令

然后在slave这边执行

则master可以通过ssh无密码登录slave

（2）配置所有Slave无密码登录Master

和上面同理，把Slave的公钥追加到Master的".ssh"文件夹下的"authorized_keys，不过是调换过来

5.修改主机名和ip

vi /etc/hostname 改为Master或者slave （后面namenode格式化时发现并没有修改成功,可能因为当时我打开 /etc/hostname 这个文件是空的和视频里不同，后来换了种方法更改主机名，即在/etc/sysconfig/network下更改，不过需要重启后才生效，可通过hostname命令查看主机名）

vi /etc/hosts 注释掉原有的，添加上映射，譬如 192.168.50.154 Master （改成自己对应IP）

注意：要进行多项映射，进行这项之后master和slave之间是否可以ping通