适用于只有一台电脑并且想学hadoop的用户。伪分布式可以使用户方便的学习hadoop。本文以ubuntu14.04和hadoop2.6.0为例介绍hadoop的伪分布式安装过程。
安装hadoop。首先创建Hadoop的文件夹,使用指令
sudo mkdir /usr/local/hadoop
,将hadoop安装到该文件夹,使用指令tar -zxvf hadoop-2.6.0.tar.gz -C /usr/local/hadoop
。修改hadoop的配置文件。首先进入配置文件所在的文件夹,使用指令
cd /usr/local/hadoop/hadoop-2.6.0/etc/hadoop
。
hadoop-env.sh文件:使用指令vim hadoop-env.sh
(如果不会使用vim可以使用gedit来替换vim) 找到文件中java位置并修改为export JAVA_HOME=你的java所在目录
。
hdfs-site.xml:在<configuration >
和</configuration >
标签之间添加指令<property>
<name>dfs.replication</name>
<value>1</value><!--此处是分片复制个数,因为伪分布只有一台主机所以此处是1-->
</property>
yarn-site.xml:在<configuration >
和</configuration >
标签之间添加指令<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value><!--此处修改为自己的主机名-->
</property>
<!-- reducer获取数据的方式 -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
core-site.xml:在<configuration >
和</configuration >
标签之间添加指令<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value><!--将master改为自己的主机名-->
</property>
<!-- 指定hadoop运行时产生文件的存储目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop/hadoop-2.6.0/data/</value>
</property>
mapred-site.xml:原配置文件中无此文件需要使用指令mv mapred-site.xml.template mapred-site.xml
生成一个。在<configuration >
和</configuration >
标签之间添加指令<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
5. 将hadoop添加到环境变量vim /etc/proflie
添加三行代码
然后使用指令
export JAVA_HOME=你自己的java目录
export HADOOP_HOME=/usr/local/hadoop/hadoop-2.6.0
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbinsource /etc/profile
使修改生效。
6.格式化namenode(是对namenode进行初始化)
指令为hdfs namenode -format (hadoop namenode -format)
注意会在格式化中出现一条success的提示说明安装成功。
7.启动hadoop
使用指令sbin/start-all.sh
8.验证是否启动成功
使用jps
命令验证,如果出现以下六条进程则说明hadoop安装成功。
NameNode
Jps
SecondaryNameNode
NodeManager
ResourceManager
DataNode