Hadoop(一)乌班图伪分布式安装Hadoop
1.打开终端
2.安装jdk,去官网中下载jdk(此处只作简单的介绍)-->解压-->配置环境
3.配置SSH免登录
4.配置hadoop环境
4.1官网路径,下载(这里使用的是2.6.4)http://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.6.4/hadoop-2.6.4.tar.gz
4.2解压hadoop-2.6.4.tar.gz,并重命名为hadoop
tar xzvf hadoop-2.4.0.tar.gz
mv hadoop-2.4.0 hadoop
4.3配置环境变量,内容如下,而后使之生效:source /etc/environment
4.4在这里提一句,单机模式无需仁和配置 可以直进行测试,略之
4.5伪分布式模式配置:
4.5.1在当前用户目录下创建文件夹tmp/hadoop_tmp
4.5.2etc/hadoop下存放配置文件
4.5.2.1修改hadoop-env.sh
将export JAVA_HOME=${JAVA_HOME}改为你自己安装的jdk路径:
export JAVA_HOME=/usr/lib/java/jdk1.8.0_73
4.5.2.2修改core-site.xml
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
<final>true</final>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/judy/tmp/hadoop_tmp</value>
</property>
</configuration>
<configuration>
<property>
<name>dfs.namenode.name.dir</name>
<value>/home/judy/Desktop/Hadoop/hadoop/dfs/namenode</value>
<final>true</final>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/home/judy/Desktop/Hadoop/hadoop/dfs/datanode</value>
<final>true</final>
</property>
<property>
<name>dfs.http.address</name>
<value>localhost:50070</value>
<description>
The address and the base port where the dfs namenode web ui will listen on.
If the port is 0 then the server will start on a free port.
</description>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
</configuration>
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapred.job.tracker</name>
<value>hdfs://localhost:9001</value>
</property>
<property>
<name>mapred.system.dir</name>
<value>file:/home/ylf/hadoop/mapred/system</value>
<final>true</final>
</property>
<property>
<name>mapred.local.dir</name>
<value>file:/home/ylf/hadoop/mapred/local</value>
<final>true</final>
</property>
</configuration>
<configuration>
<!-- Site specific YARN configuration properties --> <property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
<description>shuffle service that needs to be set for Map Reduce to run</description>
</property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>localhost</value>
<description>hostname of Resource Manager</description>
</property>
</configuration>
localhost
默认就是localhost,所以不用修改。
启动伪分布式模式:
第一次启动都要格式化下数据文件,命令:
./bin/hdfs namenode -format
格式化将会在在hdfs文件夹下新建datanode和namenode
4.3启动hadoop
./sbin/start-all.sh
停止
./sbin/stop-all.sh
jps
4.5JobHistoryServer启动
4.6启动结果
web访问端口
NameNode | 50070 |
ResourceManager | 8088 |
MapReduce JobHistory Server | 19888 |
以上为乌班图的搭建方式;
我自己还在centos 6.5上进行了搭建,参考的是:http://www.linuxidc.com/Linux/2016-07/133508.htm
并且遇到了一些坑,希望对你们有帮助:http://blog.csdn.net/u013725455/article/details/70147331
以及如需要对外访问记得添加防火墙端口:
8088:hadoop集群管理界面
50070:hdfs的管理界面
9000:hdfs仓储地址