编译安装hadoop2.6.0-废弃不再使用该文档

最新推荐文章于 2020-06-01 16:40:07 发布

zhao8209

最新推荐文章于 2020-06-01 16:40:07 发布

阅读量492

点赞数

分类专栏：大数据

本文链接：https://blog.csdn.net/u013619834/article/details/42298325

版权

大数据专栏收录该内容

8 篇文章 0 订阅

订阅专栏

编译hadoop
1. 安装jdk
http://blog.csdn.net/u013619834/article/details/38894649

2. 安装maven
wget http://mirror.bit.edu.cn/apache/maven/maven-3/3.2.5/binaries/apache-maven-3.2.5-bin.tar.gz
tar zxvf apache-maven-3.2.5-bin.tar.gz
mv apache-maven-3.2.5 /usr/local
添加环境变量
echo "export MAVEN_HOME=/usr/local/apache-maven-3.2.5" >> /etc/profile.d/app.sh
echo "export PATH=\$MAVEN_HOME/bin:\$PATH" >> /etc/profile.d/app.sh
source /etc/profile
mvn --version

3. 安装protobuf
yum -y install gcc gcc-c++ make
https://code.google.com/p/protobuf/downloads/list

tar zxvf protobuf-2.5.0.tar.gz
cd protobuf-2.5.0
./configure --prefix=/usr/local/protobuf
make
make install
echo "export PROTOC_HOME=/usr/local/protobuf" >> /etc/profile.d/app.sh
echo "export PATH=\$PROTOC_HOME/bin:\$PATH" >> /etc/profile.d/app.sh
source /etc/profile
protoc --version

4. 安装其他依赖
yum -y install cmake openssl-devel ncurses-devel autoconf automake libtool

编译hadoop
tar zxvf hadoop-2.6.0-src.tar.gz
cd hadoop-2.6.0-src

由于maven国外服务器可能连不上，先给maven配置一下国内镜像,在<mirrors></mirros>里添加，原本的不要动
vim /usr/local/apache-maven-3.2.5/conf/settings.xml
    <mirror>
      <id>nexus-osc</id>
      <mirrorOf>*</mirrorOf>
      <name>Nexusosc</name>
      <url>http://maven.oschina.net/content/groups/public/</url>
    </mirror>

使用maven进行编译
cd /usr/local/src/hadoop-2.6.0-src
mvn package -DskipTests -Pdist,native -Dtar

查看编译后的文件
ls hadoop-dist/target
cp hadoop-dist/target/hadoop-2.6.0.tar.gz /usr/local/src

以下是安装hadoop的过程

1. 安装jdk
http://blog.csdn.net/u013619834/article/details/38894649

2. 安装zookeeper
http://blog.csdn.net/u013619834/article/details/41316957

3. 创建hadoop用户(所有节点)
useradd hadoop
passwd hadoop

4. 设置hostname(所有节点)
vim /etc/sysconfig/network
修改为
master/slave1/slave2/slave3

hostname master/slave1/slave2/slave3

5. 添加host文件(所有节点)
vim /etc/hosts
10.200.3.151 slave1
10.200.3.152 slave2
10.200.3.153 slave3
10.200.3.154 master

6. 设置hadoop用户SSH无密码登陆(master节点)
su - hadoop
ssh-keygen -t rsa
ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@master
ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@slave1
ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@slave2
ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@slave3
exit

7. 复制复制hadoop程序到/opt(master节点)
tar zxvf hadoop-2.6.0.tar.gz
mv hadoop-2.6.0 /opt/hadoop
chown -R hadoop.hadoop /opt/hadoop

创建hadoop数据目录(所有节点)
mkdir -p /data/hadoop/dfs/name
mkdir -p /data/hadoop/dfs/data
mkdir -p /data/hadoop/temp
chown -R hadoop.hadoop /data/hadoop

7. 修改配置文件
cd /opt/hadoop/etc/hadoop
如果profile已经配置了JAVA_HOME,下面两文件不用修改
vim hadoop-env.sh
vim yarn-env.sh

vim slaves
添加
slave1
slave2
slave3

vim core-site.xml
<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:9000</value>
        <description>NameNode URI</description>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/data/hadoop/temp</value>
        <description>Abase for other temporary directories.</description>
    </property>
    <property>
        <name>io.file.buffer.size</name>
        <value>131072</value>
    </property>
    <property>
        <name>ha.zookeeper.quorum</name>
        <value>10.200.3.151:2181,10.200.3.152:2181,10.200.3.153:2181</value>
    </property>
</configuration>

vim hdfs-site.xml
<configuration>
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>master:9001</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/data/hadoop/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/data/hadoop/dfs/data</value>
    </property>
    <property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
    <property>
        <name>dfs.webhdfs.enabled</name>
        <value>true</value>
    </property>
</configuration>

cp mapred-site.xml.template mapred-site.xml
vim mapred-site.xml
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>master:10020</value>
    </property>
    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>master:19888</value>
    </property>
</configuration>

vim yarn-site.xml
<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.resourcemanager.address</name>
        <value>master:8032</value>
    </property>
    <property>
        <name>yarn.resourcemanager.scheduler.address</name>
        <value>master:8030</value>
    </property>
    <property>
        <name>yarn.resourcemanager.resource-tracker.address</name>
        <value>master:8031</value>
    </property>
    <property>
        <name>yarn.resourcemanager.admin.address</name>
        <value>master:8033</value>
    </property>
    <property>
        <name>yarn.resourcemanager.webapp.address</name>
        <value>master:8088</value>
    </property>
</configuration>

8. 配置好以后将hadoop目录分别copy到其它3个节点上
chown -R hadoop.hadoop /opt/hadoop（所有节点）
su - hadoop
scp -r /opt/hadoop hadoop@slave1:/opt
scp -r /opt/hadoop hadoop@slave2:/opt
scp -r /opt/hadoop hadoop@slave3:/opt

9. 添加环境变量（所有节点）
echo "export HADOOP_HOME=/opt/hadoop" >>/etc/profile.d/app.sh
echo "export PATH=\$PATH:\$HADOOP_HOME/bin:\$HADOOP_HOME/sbin" >>/etc/profile.d/app.sh
source /etc/profile

10.初始化及启动hadoop（master）
su - hadoop

查看hadoop版本
hadoop version

格式化namenode
hdfs namenode -format

启动hdfs
start-dfs.sh

查看java进程
jps