Hadoop分布式集群搭建

前面分享了hadoop伪分布式的搭建方法,这次来分享一下分布式方式的搭建方法。
主机安装或虚拟机安装这里就不再赘述,下面直接进入正题:

1.下面是网络配置,全部为静态:

master : 192.168.80.128
slave-1 : 192.168.80.129
slave-2 : 192.168.80.130
slave-3 : 192.168.80.131
slave-4 : 192.168.80.132

2.修改hosts,加入如下内容:

192.168.80.128 master
192.168.80.129 slave1
192.168.80.130 slave2
192.168.80.131 slave3
192.168.80.132 slave4

3.修改各个主机的hostname,为对应的名字

4.配置SSH免密码登陆,保证五台主机任意之间可以免密码访问

5.关闭五台主机防火墙

$ sudo systemctl stop firewalld.service
$ sudo systemctl disable firewalld.service

必须关闭防火网,否则在存储文件时,可能会出现以下错误:

[zhoupan@master ~]$ hadoop-2.8.0/bin/hadoop fs -put hadoop-2.8.0.tar.gz /data
17/07/14 01:47:58 WARN hdfs.DataStreamer: DataStreamer Exception
org.apache.hadoop.ipc.RemoteException(java.io.IOException): File /input/hadoop-2.8.0.tar.gz._COPYING_ could only be replicated to 0 nodes instead of minReplication (=1).  There are 0 datanode(s) running and no node(s) are excluded in this operation.
    at org.apache.hadoop.hdfs.server.blockmanagement.BlockManager.chooseTarget4NewBlock(BlockManager.java:1733)
    at org.apache.hadoop.hdfs.server.namenode.FSDirWriteFileOp.chooseTargetForNewBlock(FSDirWriteFileOp.java:265)
    at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.getAdditionalBlock(FSNamesystem.java:2496)
    at org.apache.hadoop.hdfs.server.namenode.NameNodeRpcServer.addBlock(NameNodeRpcServer.java:828)
    at org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolServerSideTranslatorPB.addBlock(ClientNamenodeProtocolServerSideTranslatorPB.java:506)
    at org.apache.hadoop.hdfs.protocol.proto.ClientNamenodeProtocolProtos$ClientNamenodeProtocol$2.callBlockingMethod(ClientNamenodeProtocolProtos.java)
    at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRp
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
搭建Hadoop分布式集群,你需要按照以下步骤进行操作: 1. 安装Java:Hadoop是用Java编写的,所以首先需要安装Java环境。确保你的系统上已经安装了Java,并设置好JAVA_HOME环境变量。 2. 下载Hadoop:从Apache官网下载最新版本的Hadoop。选择一个稳定版本并下载压缩包。 3. 解压Hadoop压缩包:将下载的压缩包解压到你选择的目录中。 4. 配置Hadoop:进入解压后的Hadoop目录,编辑`etc/hadoop/core-site.xml`文件,设置以下属性: ``` <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> ``` 编辑`etc/hadoop/hdfs-site.xml`文件,设置以下属性: ``` <property> <name>dfs.replication</name> <value>3</value> </property> ``` 编辑`etc/hadoop/mapred-site.xml.template`文件,设置以下属性: ``` <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> ``` 将该文件另存为`etc/hadoop/mapred-site.xml`。 5. 配置主机文件:在`etc/hadoop/workers`文件中,列出你希望成为集群节点的主机名或IP地址。每行一个主机。 6. 配置SSH免密码登录:确保你可以通过SSH免密码登录到所有集群节点。可以使用`ssh-keygen`命令生成SSH密钥对,并将公钥拷贝到所有节点的`~/.ssh/authorized_keys`文件中。 7. 格式化HDFS:运行以下命令来格式化HDFS: ``` bin/hdfs namenode -format ``` 8. 启动Hadoop集群:运行以下命令启动Hadoop集群: ``` sbin/start-dfs.sh sbin/start-yarn.sh ``` 运行以上命令后,你的Hadoop分布式集群就会启动起来。 这是一个基本的Hadoop分布式集群搭建过程,你可以根据自己的需求进行进一步的配置和调优。还有其他一些配置文件和命令可以帮助你管理和监控Hadoop集群,你可以查阅Hadoop官方文档来获取更多详细信息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值