摘要:本文主要讲述Linux环境下搭建hadoop平台过程中,基于hadoop单机模式运行正确的基础上,配置hadoop的伪分布式模式,并在配置完毕的基础上运行hadoop的伪分布式实例。
环境说明:文章延续hadoop平台搭建(3)中的步骤,因为只涉及hadoop自身配置文件的修改,所以操作步骤适用于所有版本的Linux系统。
Hadoop 可以在单节点上以伪分布式的方式运行,Hadoop 进程以分离的 Java 进程来运行,节点既作为 NameNode 也作为 DataNode。(注意,伪分布式读取的是 分布式文件系统hdfs 中的文件。)
Hadoop 的配置文件位于 /usr/local/hadoop/etc/hadoop/ 中,伪分布式需要修改2个配置文件 core-site.xml 和 hdfs-site.xml 。(注意,在比较老的版本比如hadoop1.x中,没有core-site.xml文件,需要做相应调整)
1修改配置文件core-site.xml、hdfs-site.xml
打开core-site.xml文件
命令:
sudo gedit ./etx/hadoop/core-site.xml
将文件内容修改为如下:
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>file:/home/hadoop/develop/hadoop/myhadooptemp</value>
<description>Abase for other temporary directories.</description>
</property>
<property>