hadoop环境搭建（二）伪分布式

最新推荐文章于 2024-09-26 13:54:23 发布

塞卡骆伊

最新推荐文章于 2024-09-26 13:54:23 发布

阅读量322

点赞数

分类专栏： hadoop 文章标签： hadoop 分布式

本文链接：https://blog.csdn.net/u013013102/article/details/52475789

版权

hadoop 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

一、下载hadoop-2.6.0.tar.gz

本文采用hadoop2.6

二、解压tar包

#tar -zxvf hadoop-2.6.0.tar.gz

三、配置环境变量

$ vim .bash_profile

export HADOOP_HOME=/home/hadoop/hadoop-2.6.0
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

$ source .bash_profile

hadoop version
Hadoop 2.6.0
Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -r e3496499ecb8d220fba99dc5ed4c99c8f9e33bb1
Compiled by jenkins on 2014-11-13T21:10Z
Compiled with protoc 2.5.0
From source with checksum 18e43357c8f927c0695f1e9522859d6a
This command was run using /home/hadoop/hadoop-2.6.0/share/hadoop/common/hadoop-common-2.6.0.jar

验证配置

四、单机版hadoop

不需要做任何配置

$ mkdir input

$ cp ./etc/hadoop/* ./input

$ hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar grep ./input ./output 'dfs[a-z.]+' 执行hadoop自带例子

$ cat ./output/* 查看结果

6 dfs.audit.logger
4 dfs.class
3 dfs.server.namenode.
2 dfs.period
2 dfs.audit.log.maxfilesize
2 dfs.audit.log.maxbackupindex
1 dfsmetrics.log
1 dfsadmin
1 dfs.servers
1 dfs.file

五、伪分布式配置

1、配置hadoop-env.sh

export JAVA_HOME=/home/hadoop/java/jdk1.7.0_40 配置JAVA环境变量

2、配置core-site.xml

<name>fs.defaultFS</name>

<value>hdfs://hadoop:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>file:/home/hadoop/hadoop-2.6.0/tmp</value>

</property>

3、配置hdfs-site.xml

<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/home/hadoop/hadoop-2.6.0/tmp/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/home/hadoop/hadoop-2.6.0/tmp/dfs/data</value>
</property>