hadoop学习笔记：从零开始搭建hadoop集群（完全分布式）

最新推荐文章于 2024-05-05 02:52:39 发布

wzx0z

最新推荐文章于 2024-05-05 02:52:39 发布

阅读量505

点赞数

分类专栏： hadoop 文章标签： hadoop集群 hadoop 分布式

本文链接：https://blog.csdn.net/wzx0z/article/details/42102597

版权

hadoop 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

平台：VM虚拟机。一共创建了三个，分别为一个master和两个slave，模拟一个小集群。

系统：Ubuntu

Java版本：jdk1.8.0_25

hadoop版本：hadoop-1.2.1

（一）在三台主机上创建相同的专用hadoop用户

:~$ sudo adduser hadoop

按向导创建用户即可

（二）修改hostname和hosts （ip及主机名按实际修改）

:~$ sudo gedit hostname

master #（其他主机为slave1/slave2）

:~$ sudo gedit hosts

192.168.163.130 master

192.168.163.131 slave1

192.168.163.132 slave2

（三）安装及配置Java环境（压缩包离线安装）红色部分按具体情况修改替换

1,在/lib下创建jdk安装目录jvm（可有可无）

:~$ sudo mkdir/lib/jvm

2,解压jdk安装包到/lib/jvm

:~$ sudo tar zxvfjdk-8u25-linux-x64.tar.gz -C/lib/jvm

3,修改/etc/profile，在文件末尾加上如下内容

:~$ sudo gedit /etc/profile

#set java environment

export JAVA_HOME=/lib/jvm/jdk1.8.0_25

export JRE_HOME=/lib/jvm/jdk1.8.0_25

export CLASSPPATH=".:$JAVA_HOME/lib:$CALSSPATAH"

export PATH="$JAVA_HOME/bin:$PATH"

4,使修改生效并查看是否安装成功

:~$ source /etc/profile

:~$ java -version

（四）安装及配置ssh

1,安装ssh，若无法获取，尝试先在终端输入sudo apt-get update

:~$ sudo apt-get install ssh

切换到创建好的hadoop用户。

2,采用dsa密钥认证，按向导，提示时一路按回车即可免密登录

:~$ ssh-keygen -t dsa

注意：以上四个操作在三个主机上都必须完成，接下来的操作只需操作master主机即可。

（五）实现master主机免密登录其他slave主机

hadoop@master:~$ cp ~/.ssh/id_dsa.pub ~/.ssh/authorized_keys

hadoop@master:~$ scp ~/.ssh/authorized_keys slave1:~/.ssh/

hadoop@master:~$ scp ~/.ssh/authorized_keys slave2:~/.ssh/

测试能否免密连接

hadoop@master:~$ ssh slave1

hadoop@master:~$ ssh slave2

（六）hadoop安装及配置(压缩包)

1,解压到hadoop用户目录

hadoop@master:~$ sudo tar zxvfhadoop-1.2.1.tar.gz

2,修改hadoop-env.sh

hadoop@master:~$ gedit hadoop-1.2.1/conf/hadoop-env.sh

export JAVA_HOME=/lib/jvm/jdk1.8.0_25

3,修改core-site.xml

hadoop@master:~$ gedit hadoop-1.2.1/conf/core-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>



<configuration>

<property>

<name>fs.default.name</name>

<value>hdfs://master:9000</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/tmp</value>

</property>

</configuration>

4,修改hdfs-site.xml

hadoop@hadoop@master:~$ gedit hadoop-1.2.1/conf/hdfs-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>



<configuration>

<property>

<name>dfs.replication</name>

<value>2</value>

</property>

</configuration>

5, 修改mapred-site.xml

hadoop@master:~$ gedit hadoop-1.2.1/conf/mapred-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>



<configuration>

<property>

<name>mapred.job.tracker</name>

<value>hdfs://master:9001</value>

</property>

</configuration>