网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
先推荐一下Hadoop入门全过程:(共15节,非常细,我也是跟着这个配置好hadoop的)
https://blog.csdn.net/m0_46413065/article/details/114667174?spm=1001.2014.3001.5501
---------作者是Leokadia Rothschild---------
为了避免不同的人在hadoop集群搭建上分配任务的差异,我在这里先列出我的分配表
- 首先在VM上克隆一个虚拟机
选择克隆
下一页
下一页
选择“创建完整克隆”
更改好克隆机名和位置,如何点击完成,如何就可以打开这台克隆虚拟机了
- 接下来我们配置IP、主机名和hosts映射(需要在root状态下)
先配置IP
按o编辑
修改ONBOOT为yes的作用是开机的时候自启网络,而不用手动开启
按一下ESC后 Shift+: 输入wq 回车,即退出
修改主机名
配置hosts映射文件
这里建议一次写入多个映射以便后面再次动态上线节点
注意,如果有修改的话应该在各个虚拟机上都将这个文件改一下,保持一致
可以了,重启一下hadoop105,因为我hosts只改了hadoop105的,所以如果你修改了所有虚拟机的hosts的话,也都需要重启
- 关闭防火墙、设置时间同步、设置免密登录
在Xshell7上连接hadoop105,如果没有这个软件的话再虚拟机内的终端执行也是一样的
这样输入IP地址就行
这里输入你虚拟机一直在用的用户名和密码就行,如何点击连接
接受并保存
如下
关闭防火墙、关闭防火墙的开机自启(如果其他虚拟机都没有关闭的话也需要关闭)
时间同步:
关闭hadoop105d1 ntp 服务和自启动
配置hadoop105与hadoop102(也就是namenode所在的虚拟机)1分钟同步一次时间
wq退出后修改hadoop105的时间,一分钟后看看时间同步能否生效
一定要保证hadoop102虚拟机是开着的,否则时间无法同步
设置免密登录:生成公、私钥,然后把公钥分发给其他虚拟机,这样所有虚拟机间就可以免密登录了
后面依次输入ssh-copy-id hadoop103/104/105 (也是需要拷贝给自己的)操作与拷贝给Hadoop102一致
之后再hadoop105的root模式下重复上面的操作,因为有些文件是需要root权限才能访问的
也是依次输入ssh-copy-id hadoop102/103/104/105 (也是需要拷贝给自己的)
ok了,因为在开头链接中的教材第九节中已经配置好了hadoop102到104的两两间的免密登录(不管是普通用户还是root用户),而我们刚刚已经配置好了hadoop102/103/104/105访问hadoop105的免密登录,只差反方向的免密登录,也就是hadoop105访问hadoop102/103/104/105的免密登录,所以需要依次在hadoop102/103/104上做如下配置
hadoop103/104只需要效仿hadoop102这样做即可
接下来验证一下能否在其他机器登入hadoop105(如下,无需密码,成功)
- 获取JDK、hadoop文件
将hadoop102的jdk(是解压后的)拷贝到105上
在hadoop105上检查,jdk存在
(在这个过程中也是在实验我们免密登录成功与否,如果发送的同时无需输入密码,则是免密登录成功)
此时我们可以反过来,在hadoop105中使用scp命令向hadoop102“索要”文件看免密登录成功与否,我们正好需要hadoop,如下所示:(无需密码,免密登录成功)
在hadoop105上检查是否索要成功
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!