Ubuntu 下,Hadoop 单机伪分布式部署

本文档详细介绍了在Ubuntu系统中如何进行Hadoop的单机伪分布式部署,包括安装Java、配置SSH、下载及校验Hadoop、修改配置文件(如hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml),以及启动HDFS、YARN和历史服务器。最后,通过wordcount实例验证了Hadoop环境的正确设置,并提供了查看HDFS和任务运行情况的Web界面地址。
摘要由CSDN通过智能技术生成

安装Java

https://blog.csdn.net/yitengtongweishi/article/details/81946349

配置ssh

https://blog.csdn.net/yitengtongweishi/article/details/81946083

安装Hadoop

Hadoop Releases
单击上述链接,下载需要的版本。笔者选择的是 hadoop-2.6.5.tar.gz 和 hadoop-2.6.5.tar.gz.mds。
校验 下载的Hadoop 压缩文件

blockchain@Dao:~$ md5sum Downloads/hadoop-2.6.5.tar.gz
967c24f3c15fcdd058f34923e92ce8ac  Downloads/hadoop-2.6.5.tar.gz
blockchain@Dao:~$ 
blockchain@Dao:~$ cat Downloads/hadoop-2.6.5.tar.gz.mds 
hadoop-2.6.5.tar.gz:    MD5 = 96 7C 24 F3 C1 5F CD D0  58 F3 49 23 E9 2C E8 AC
hadoop-2.6.5.tar.gz:   SHA1 = 877B FD6E 3577 3E4B 9021  53BD BD89 877B F360 5BA4
hadoop-2.6.5.tar.gz: RMD160 = 1F4D 4D66 26D4 ED7F 0F90  45D6 ADF8 5314 6C80 112C
hadoop-2.6.5.tar.gz: SHA224 = F187156E B23AA6D6 6BAD2788 4EB0480C 006732D3
                              E6EF3033 093750CF
hadoop-2.6.5.tar.gz: SHA256 = 001AD18D 4B6D0FE5 42B15DDA DBA2D092 BC97DF1C
                              4D2D7973 81C8D128 87691898
hadoop-2.6.5.tar.gz: SHA384 = 9B4B0CAE AD744C17 62660C76 11EEB503 B0F04ED6
                              6CF54B45 1196D68F 3129369E 04279893 B63A7799
                              AE45CA9D 3ECE13F9
hadoop-2.6.5.tar.gz: SHA512 = FD9D2415 5BB18475 C25BC6A8 8284A696 224D5EF3
                              8503C5C3 F1D4C0B6 5AE1C552 D90D2136 CA0FA452
                              94D62204 EED3D115 4785C12C C260CCA4 2EA2FBF0
                              27B461B2
blockchain@Dao:~$ 

校验成功后,解压 Hadoop 压缩文件

blockchain@Dao:~$ tar -zxvf Downloads/hadoop-2.6.5.tar.gz -C ~

修改文件夹属性,避免恼人的权限问题

blockchain@Dao:~$ sudo chown blockchain:blockchain -R /home/blockchain/hadoop-2.6.5/

编辑 ~/.bashrc ,在文件末尾添加

#Hadoop
export HADOOP_HOME=$HOME/hadoop-2.6.5
export PATH=$PATH:${HADOOP_HOME}/bin

使配置立即生效

blockchain@Dao:~$ source ~/.bashrc 

切换至 ${HADOOP_HOME}/etc/hadoop 目录,

blockchain@Dao:~/hadoop-2.6.5/etc/hadoop$ cd /home/blockchain/hadoop-2.6.5/etc/hadoop/ ; ls -lt
total 152
-rw-rw-r-- 1 blockchain blockchain  4436 10月  3  2016 capacity-scheduler.xml
-rw-rw-r-- 1 blockchain blockchain  1335 10月  3  2016 configuration.xsl
-rw-rw-r-- 1 blockchain blockchain   318 10月  3  2016 container-executor.cfg
-rw-rw-r-- 1 blockchain blockchain   775 10月  3  2016 hdfs-site.xml
-rw-rw-r-- 1 blockchain blockchain  1449 10月  3  2016 httpfs-env.sh
-rw-rw-r-- 1 blockchain blockchain  1657 10月  3  2016 httpfs-log4j.properties
-rw-rw-r-- 1 blockchain blockchain    21 10月  3  2016 httpfs-signature.secret
-rw-rw-r-- 1 blockchain blockchain   620 10月  3  2016 httpfs-site.xml
-rw-rw-r-- 1 blockchain blockchain  3523 10月  3  2016 kms-acls.xml
-rw-rw-r-- 1 blockchain blockchain  1325 10月  3  2016 kms-env.sh
-rw-rw-r-- 1 blockchain blockchain  1631 10月  3  2016 kms-log4j.properties
-rw-rw-r-- 1 blockchain blockchain  5511 10月  3  2016 kms-site.xml
-rw-rw-r-- 1 blockchain blockchain   938 10月  3  2016 mapred-env.cmd
-rw-rw-r-- 1 blockchain blockchain  1383 10月  3  2016 mapred-env.sh
-rw-rw-r-- 1 blockchain blockchain  4113 10月  3  2016 mapred-queues.xml.template
-rw-rw-r-- 1 blockchain blockchain   758 10月  3  2016 mapred-site.xml.template
-rw-rw-r-- 1 blockchain blockchain    10 10月  3  2016 slaves
-rw-rw-r-- 1 blockchain blockchain  2237 10月  3  2016 yarn-env.cmd
-rw-rw-r-- 1 blockchain blockchain  4567 10月  3  2016 yarn-env.sh
-rw-rw-r-- 1 blockchain blockchain   690 10月  3  2016 yarn-site.xml
-rw-rw-r-- 1 blockchain blockchain   774 10月  3  2016 core-site.xml
-rw-rw-r-- 1 blockchain blockchain  3670 10月  3  2016 hadoop-env.cmd
-rw-rw-r-- 1 blockchain blockchain  4224 10月  3  2016 hadoop-env.sh
-rw-rw-r-- 1 blockchain blockchain  2598 10月  3  2016 hadoop-metrics2.properties
-rw-rw-r-- 1 blockchain blockchain  2490 10月  3  2016 hadoop-metrics.properties
-rw-rw-r-- 1 blockchain blockchain  9683 10月  3  2016 hadoop-policy.xml
-rw-rw-r-- 1 blockchain blockchain 11291 10月  3  2016 log4j.properties
-rw-rw-r-- 1 blockchain blockchain  2316 10月  3  2016 ssl-client.xml.example
-rw-rw-r-- 1 blockchain blockchain  2268 10月  3  2016 ssl-server.xml.example
blockchain@Dao:~/hadoop-2.6.5/etc/hadoop$ 

修改 hadoop-env.sh 中的部分内容:

# The java implementation to use.
#export JAVA_HOME=${JAVA_HOME}
export JAVA_HOME=${HOME}/jdk1.8.0_181

修改配置文件 core-site.xml,修改后的内容如下:

<configuration>
        <property>
             <name>hadoop.tmp.dir</name>
             <value>file:/home/blockchain/hadoop-2.6.5/tmp</value>
             <description>Abase for other temporary directories.</description>
        </property>
        <property>
             <name>fs.defaultFS</name>
             <value>hdfs://localhost:9000</value>
        </property>
</configuration>

修改配置文件 hdfs-site.xml,修改后的内容如下:

<configuration>
        <property>
             <name>dfs.replication</name>
             <value>1</value>
        </property>
       
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值