1.1.1部署（Apache Hadoop）伪分布式集群

最新推荐文章于 2024-07-11 18:52:23 发布

guodianzhanghui

最新推荐文章于 2024-07-11 18:52:23 发布

阅读量114

点赞数

分类专栏： 11 文章标签： hadoop

本文链接：https://blog.csdn.net/guodianzhanghui/article/details/70226792

版权

11 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

前言

又一次打算入坑，投入大数据怀抱，在大数据森林之中做一颗小撸，安安静静的茁壮成长。在网上浏览了几位大神写的帖子后，对hadoop也有了一定了解，决定动动手，先搭建一个运行环境。关于hadoop版本的选择, 目前市场上存在的版本不少，用的比较主流的如：Apache（原生态，开源）、CDH(Cloudera)、Hortonworks等等，纠结了半天，出于更好的了解配置参数、配置文件、常规命令以及核心技术知识的目的，一键安装的不要，选择原生态开源，选择Apache版本，尝试部署Apache Hadoop2.7.3伪分布式集群。

一、准备

1.1、准备安装包

宿主机（用于跑虚拟机，我用的是IMAC pro）

VMware Fusion 8.5.3 (虚拟机，如果用的是windows系统，可选择VMware12 workstation系列)

centos 6.8 64位

jdk-8u101-linux-x64.tar

apache hadoop-2.7.3.tar.gz

secureCRT

1.2、制定一个简单的集群架构

主机名/HOSTNAME IP 运行角色
Master 192.168.79.172 NameNode、SecondaryNameNode、ResourceManager
Slave1 192.168.79.173 DataNode、NodeManager
Slave2 192.168.79.174 DataNode、NodeManager

1.3、安装centos虚拟机（安装三台，分别为 Master、Slave1、Slave2）

安装过程参考：https://jingyan.baidu.com/article/25648fc1a235c99191fd0008.html

二、配置虚拟环境

三台虚拟机安装完成后，接下来就需要在每台虚拟机上配置hadoop运行的依赖环境

2.1、根据1.2架构设计，设定三台虚拟机IP

此步骤所有虚拟机都要操作

vi/etc/sysconfig/network-scripts/ifcfg-eth0

2.2、根据1.2架构设计，设定三台虚拟机主机名

此步骤所有虚拟机都要操作

[root@Master ~]# hostname Master
[root@Master ~]# vi /etc/sysconfig/network 修改为 HOSTNAME=Master

以上两步骤需要重启服务器后才生效

2.3、为三台虚拟机创建用户hadoop

此步骤所有虚拟机都要操作

user add hadoop

若使用vm的快速安装在安装时已经配置好用户，所以以上步骤不用搞了。

2.4、根据1.2架构设计，为三台虚拟机配置Hosts记录

vi/etc/hosts

192.168.79.172 Master

192.168.79.173 Slave1

192.168.79.174 Slave2

2.5、配置SSH，建立hadoop用户之间信任

此步骤所有虚拟机都要操作

切换至hadoop用户下执行ssh-keygen -t rsa，然后将自己的公钥以及其他服务器hadoop用户的公钥放置hadoop宿主目录下的 .ssh/authorized_keys 中，注意 authorized_keys默认不存在需要手动创建，并且必须设置权限为600

步骤参考;

1) 在namenode机器上，在hadoop用户下执行下面命令

ssh-keygen -t rsa

遇到所有选项回车默认值即可

2) 导入公钥到本机认证文件

cat ~/.ssh/id_rsa.pub>>~/.ssh/authorized_keys

另外两台的公钥也放到这文件中再传到各个节点

3) 导入公钥到其他datanode节点认证文件

scp ~/.ssh/authorized_keys hadoop@Slave1:/home/hadoop/.ssh/authorized_keys

scp ~/.ssh/authorized_keys hadoop@Slave2:/home/hadoop/.ssh/authorized_keys

以上过程由于是第一次传输访问，系统会提示输入hadoop用户的密码，输入密码即可。

2.6、安装JAVA

此步骤所有虚拟机都要操作

1）上传jdk-8u101-linux-x64.tar至usr目录下，解压缩该压缩包，并对压缩后文件夹重命名为jdk1.8

2) 修改PATH变量

执行 vi /etc/profile 修改profile配置文件，增加如下内容

export JAVA_HOME=/usr/jdk1.8
export CLASSPATH=:$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
export PATH=:$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH

3）

2.6、安装JAVA

guodianzhanghui

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
1.1.1部署（Apache Hadoop）伪分布式集群

前言又一次打算入坑，投入大数据怀抱，在大数据森林之中做一颗小撸，安安静静的茁壮成长。在网上浏览了几位大神写的帖子后，对hadoop也有了一定了解，决定动动手，先搭建一个运行环境。关于hadoop版本的选择,目前市场上存在的版本不少，用的比较主流的如：Apache（原生态，开源）、CDH(Cloudera)、Hortonworks等等，纠结了半天，出于
复制链接

扫一扫

专栏目录

主机名/HOSTNAME	IP	运行角色
Master	192.168.79.172	NameNode、SecondaryNameNode、ResourceManager
Slave1	192.168.79.173	DataNode、NodeManager
Slave2	192.168.79.174	DataNode、NodeManager

1.1.1部署（Apache Hadoop）伪分布式集群

“相关推荐”对你有帮助么？