hadoop上路记 - 安装

最新推荐文章于 2024-06-04 21:09:46 发布

sunfan1010

最新推荐文章于 2024-06-04 21:09:46 发布

阅读量225

点赞数 1

分类专栏： hadoop

本文链接：https://blog.csdn.net/sunfan1010/article/details/76189690

版权

hadoop 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

看官方安装需求：

Required Software

Required software for Linux include:

1. Java™ must be installed. Recommended Javaversions are described at HadoopJavaVersions.

2. ssh must be installed and sshd must berunning to use the Hadoop scripts that manage remote Hadoop daemons.

1、配置SSH无密码登录

Centos 默认没有启动SSH无密登录，去掉/etc/ssh/sshd_config中的注释

#RSAAuthenticationyes

#PubkeyAuthenticationyes

# ssh-keygen -tdsa -P '' -f ~/.ssh/id_dsa

# cat~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

验证 # ssh localhost

Last login: ThuJul 27 22:53:44 2017 from localhost

查看是否安装rsync

# rpm -qa |greprsync -i
rsync-3.0.6-12.el6.i686

2、安装hadoop

去官方吧， http://hadoop.apache.org/releases.html

下载2.7.3版本 .3.0已经有alpha4, 下载完成后发现tar.gz有205M

/usr/local 目录下解压

$ tar -zxvfhadoop-2.7.3.tar.gz

$ bin/hadoop 显示参数用法

hadoop支持三种模式：

Local(Standalone)Mode \ Pseudo-Distributed Mode \ Fully-Distributed Mode

默认情况下hadoop配置为non-distributedmode, as a single Java process. 方便调试

1)建立目录 tmp hdfs hdfs/data hdfs/name

$ mkdir tmp hdfs
$ mkdir hdfs/data hdfs/name

3、hadoop 的配置文件

涉及到的相关文件

hadoop-env.sh

core-site.xml

yarn-env.sh

hdfs-site.xml

mapred-site.xml

yarn-site.xml

1)配置文件 etc/hadoop/hadoop-env.sh

#exportJAVA_HOME=${JAVA_HOME}
export JAVA_HOME=/usr/local/jdk

2)配置文件 etc/hadoop/yarn-env.sh

#exportJAVA_HOME=/home/y/libexec/jdk1.6.0/
export JAVA_HOME=/usr/local/jdk/

3)配置文件 etc/hadoop/core-site.xml:

HDFS的URI，文件系统://namenode标识:端口号

namenode上本地的hadoop临时文件夹

<name>fs.defaultFS</name>

<value>hdfs://localhost:9000</value>

</property>

<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop-2.7.3/tmp</value>
</property>

</configuration>

4)配置文件 etc/hadoop/hdfs-site.xml:

副本个数，配置默认是3,应小于datanode机器数量

<property>
<name>dfs.name.dir</name>
<value>/usr/local/hadoop-2.7.3/hdfs/name</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/usr/local/hadoop-2.7.3/hdfs/data</value>
</property>

<name>dfs.replication</name>

</property>

</configuration>

5）配置文件 etc/hadoop/mapred-site.xml

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

6）配置文件 etc/hadoop/yarn-site.xml

<configuration>


<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>192.168.253.119:8099</value>
</property>
</configuration>

$ bin/hdfs namenode -format

启动hadoop

$ sbin/start-dfs.sh

启动yarn

$sbin/start-yarn.sh

7/07/28 00:03:14WARN util.NativeCodeLoader: Unable to load native-hadoop library for yourplatform... using builtin-java classes where applicable

出现WARN，但查看有启动，不影响使用

$ jps

4593 NodeManager
3571 DataNode
4677 Jps
4494 ResourceManager
3742 SecondaryNameNode

应该是5个，怎么少一个NameNade

关闭 sbin/stop-dfs.sh 重format

bin/hadoop namecode -format