Hadoop集群安装&测试

最新推荐文章于 2024-04-29 10:03:19 发布

高福来

最新推荐文章于 2024-04-29 10:03:19 发布

阅读量183

点赞数

本文链接：https://blog.csdn.net/gaofulai1988/article/details/103040973

版权

之前看过不少hadoop理伦的文章和书籍，一直想搭建一个集群玩玩，笔记本电脑不给力，给它加了一个4G内存后，在周末的时候，花了差不多一天的时间才把集群搭建好，中间也遇到了一些问题，还好最终搭建成功了，开始大数据之旅吧。

1. 安装JDK

1）首先要卸载掉默认安装的JDK

### 查看安装所有的JDK信息

rpm -qa | grep jdk

### 卸载掉JDK,xxx代表的是上个命令输出的结果

yum -y remove java xxx

2）安装rz工具在root权限下上传，不要勾选以ASCII码上传！！！

yum install lrzsz

3) 上传JDK之后进行安装JDK

tar -zxvf jdk-7u79-linux-x64.tar.gz

vi /etc/profile

#set java environment

JAVA_HOME=/usr/java/jdk1.7.0_79

JRE_HOME=/usr/java/jdk1.7.0_79/jre

CLASS_PATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib

PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin

export JAVA_HOME JRE_HOME CLASS_PATH PATH

4）测试JDK

java -version

2. 节点配置，准备四个节点

vm01 192.168.141.128 master节点

vm02 192.168.141.129

vm03 192.168.141.130

vm04 192.168.141.131

1）在/etc/hostname下修改名字

2）在/etc/hosts下增加各个节点的名字

192.168.141.128 vm01

192.168.141.129 vm02

192.168.141.130 vm03

192.168.141.131 vm04

3）增加ssh 无密码登录

在master节点上执行 ssh-keygen -t rsa 一路回车键

cp id_rsa.pub authorized_keys

然后scp /root/.ssh/ vm02:/root/.ssh

scp /root/.ssh/ vm03:/root/.ssh

scp /root/.ssh/ vm04:/root/.ssh

此时再ssh登录任何一台机器都是ok的

3. master节点上安装hadoop

1）下载好hadoop，我使用的是2.7.1版本，通过rz命令上传后，解压

2）在master节点上进行配置

在hadoop-env.sh 文件中修改JDK路径和设置HADOOP_HEAPSIZE=128

core-site.xml 文件配置如下：

<name>fs.defaultFS</name>

</property>

<name>dfs.namenode.checkpoint.period</name>

</property>

<name>fs.checkpoint.size</name>

</property>

<name>fs.trash.interval</name>

</property>

<name>hadoop.tmp.dir</name>

<value>/data/hadoop/tmp</value>

</property>

<name>io.file.buffer.size</name>

</property>

hdfs-site.xml 文件配置如下：

<name>dfs.namenode.name.dir</name>

<value>/data/hadoop/hdfs/name</value>

<description>HDFS namenode数据镜象目录</description>

</property>

<name>dfs.datanode.data.dir</name>

<value>/data/hadoop/hdfs/data</value>

<description>HDFS datanode数据镜象存储路径</description>

</property>

<name>dfs.namenode.http-address</name>

</property>

<name>dfs.namenode.secondary.http-address</name>

</property>

<name>dfs.webhdfs.enabled</name>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.datanode.du.reserved</name>

</property>

<name>dfs.block.size</name>

</property>

<name>dfs.permissions.enabled</name>

<value>false</value>

</property>

mapred-site.xml 文件配置如下：

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.jobtracker.http.address</name>

</property>

<name>mapred.job.tracker</name>

</property>

<name>mapreduce.jobhistory.address</name>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

</property>

yarn-site.xml配置如下：

<name>mapreduce.framework.name</name>

</property>

<name>yarn.resourcemanager.address</name>

</property>

<name>yarn.resourcemanager.scheduler.address</name>

</property>

<name>yarn.resourcemanager.resource-tracker.address</name>

</property>

<name>yarn.resourcemanager.admin.address</name>

</property>

<name>yarn.resourcemanager.webapp.address</name>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

安装完成后，可以进行测试：

hadoop-daemon.sh start namenode

hadoop-daemon.sh start datanode

yarn-daemon.sh start resourcemanager

yarn-daemon.sh start nodemanager

通过jps可以查看是否已启动了，如果没有启动成功，到对应的日志目录下查看，一般通过日志的输出可以知道什么原因，然后到网上进行搜索解决

4 集群安装

通过scp命令，将hadoop安装目录复制到vm02,vm03,vm04下

在master节点上执行

vi etc/hadoop/slaves 删除localhost，增加vm02,vm03,vm04

vi etc/hadoop/masters 增加vm02 vm02 是secondnamenode

bin/hdfs namenode -format 格式化，注意不要随意格式化，很容易导致版本不一致！！！

执行./start-all.sh 启动集群

此至集群安装成功了

5. 文件命令&mapreducer测试

bin/hdfs dfs -mkdir /test

bin/hdfs dfs -ls /

bin/hdfs dfs -put /home/gaofla/wc.txt /test/

bin/hdfs dfs -cat /test/wc.txt

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount /test/wc.txt /test/out

bin/hdfs dfs -ls /test/out

bin/hdfs dfs -cat /test/out/part-r-00000

高福来

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Hadoop集群安装&测试

之前看过不少hadoop理伦的文章和书籍，一直想搭建一个集群玩玩，笔记本电脑不给力，给它加了一个4G内存后，在周末的时候，花了差不多一天的时间才把集群搭建好，中间也遇到了一些问题，还好最终搭建成功了，开始大数据之旅吧。 1. 安装JDK 1）首先要卸载掉默认安装的JDK ### 查看安装所有的JDK信息 ...
复制链接

扫一扫