Apache Hadoop 3.0.0（一、安装）

最新推荐文章于 2024-05-10 18:55:53 发布

spaceandroid

最新推荐文章于 2024-05-10 18:55:53 发布

阅读量494

点赞数

分类专栏： hadoop 文章标签： hadoop

本文链接：https://blog.csdn.net/spaceandroid/article/details/79278335

版权

hadoop 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

作为一名老java程序员，最近想学学大数据知识，活到老学到老了，看了网上很多培训真是良莠不齐啊，如果有点基础的人员还是看官网自学吧。如果对大数据架构不清请的初学者可以参考网上一些公开课，了解要掌握哪些知识就好了，还是得在实际中应用多动手，言归正传。

按照官网教程进行安装过程：

本地模式

伪分布式

分布式

1、环境

在CentOS7上进行安装，本地虚拟机上安装好后，网络环境配置可以参考之前转发的进行配置。

2、事先准备

① 配置java_home

hadoop3.0必须在java1.8上运行，默认路径：/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.161-0.b14.el7_4.x86_64，

也可下载java解压后，在/etc/profile中配置环境变量。

② 安装ssh

 $ yum -y install openssh-server
 $ yum -y install rsyn

检查本地是否需要密码：

 $ ssh localhost

  $ ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
  $ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
  $ chmod 0600 ~/.ssh/authorized_keys

③ 修改hosts文件

如果不更改此文件启动hadoop会报错：ERROR impl.MetricsSystemImpl: Error getting localhost name. Using 'localhost'...

在hosts文件中增加配置：

 $ vi /etc/hosts
10.0.2.15   space   
(格式IP+域名或localhost)
按Esc键后，输入:wq保存推出。

3、hadoop3.0下载解压

  $ yun -y install wget
  $ cd /home/
  $ wget http://mirrors.hust.edu.cn/apache/hadoop/common/current/hadoop-3.0.0.tar.gz
  $ tar -zxvf hadoop-3.0.0.tar.gz
  $ cd /home/hadoop-3.0.0/

在解压后hadoop目录里，修改etc/hadoop/hadoop-env.sh文件：

  export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.161-0.b14.el7_4.x86_64$ bin/hadoop

试着运行如下命令 ：

$ bin/hadoop

4、本地模式

hadoop默认情况，就是个非分布式的配置，用户可以进行debug。

  $ mkdir input
  $ cp etc/hadoop/*.xml input
  $ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.0.0.jar grep input output 'dfs[a-z.]+'
  $ cat output/*

5、伪分布式

5.1 修改以下文件

① etc/hadoop/core-site.xml:

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

② etc/hadoop/hdfs-site.xml:

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

③ 修改用户定义，分别编辑开始和关闭脚本，增加内容：

$ vim sbin/start-dfs.sh

$ vim sbin/stop-dfs.sh

HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

④ 如果yarn启动，分别编辑开始和关闭脚本，增加内容：

$ vim sbin/start-yarn.sh

$ vim sbin/stop-yarn.sh

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

5.1 启动

① 格式化文件系统：

$ bin/hdfs namenode -format

② 开始NameNode daemon and DataNode daemon：

$ sbin/start-dfs.sh

在浏览器中输入：http://localhost:9870/

③ 在浏览器中输入： http://localhost:9870/

④ 创建执行MapReduce作业所需的HDFS目录:

$ bin/hdfs dfs -mkdir /user
$ bin/hdfs dfs -mkdir /user/<username>

⑤ 将input文件复制到hdfs文件系统：

$ bin/hdfs dfs -mkdir input
$ bin/hdfs dfs -put etc/hadoop/*.xml input

⑥ 运行例子：

$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.0.0.jar grep input output 'dfs[a-z.]+'

⑦ 查看ouput文件

  $ bin/hdfs dfs -get output output
  $ cat output/*

或者

 $ bin/hdfs dfs -cat output/*

⑧ 停止进程：

$ sbin/stop-dfs.sh

5.2 yarn单节点启动

上章节①~④步骤设置完成后，做如下操作：

① 修改etc/hadoop/mapred-site.xml：

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

修改etc/hadoop/yarn-site.xml：

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
    </property>
</configuration>

② 启动

$ sbin/start-yarn.sh

③ 浏览器中输入http://localhost:8088/

④ 停止启动

$ sbin/stop-yarn.sh

spaceandroid

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Apache Hadoop 3.0.0（一、安装）

作为一名老java程序员，最近想学学大数据知识，活到老学到老了，看了网上很多培训真是良莠不齐啊，如果有点基础的人员还是看官网自学吧。如果对大数据架构不清请的初学者可以参考网上一些公开课，了解要掌握哪些知识就好了，还是得在实际中应用多动手，言归正传。按照官网教程进行安装过程：本地模式伪分布式分布式 1、环境在CentOS7上进行安装，本地虚拟机上安装好后，网络环境配置可以参考之前转发的进行配置。2、...
复制链接

扫一扫

专栏目录