Hadoop配置详解

Hadoop配置
一、Hadoop集群模式:
     Hadoop集群共有三种模式:
1、单机模式(Standalone)
2、伪分布式模式(Pseudo-distributed)
3、完全分布式模式(Fully distributed)

二、三种模式的具体配置        

Component PropertyStandalonePseudo-distributed Fully distributed
Core
fs.default.name
file:/// 
hdfs://localhost/
hdfs://namenode/
HDFS
dfs.replication
N/A
1

MapReduce
mapred.job.tracker
local
localhost:8021
jobtracker:8021           

例如:Pseudo-distributed(伪分布式模式)配置

<!-- core-site.xml -->
<?xml version="1.0"?>
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost/</value>
</property>
</configuration>

<!-- hdfs-site.xml -->
<?xml version="1.0"?>
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</configuration>

<!-- mapred-site.xml -->
<?xml version="1.0"?>
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:8021</value>
</property>
</configuration>

单机模式只需对照上表配置三个文件(conf/core-site.xml,conf/hdfs-site.xml,conf/mapred-site.xml)即可.请你先测试一下单机模式,祝你好运!

三、伪分布式模式配置SSH

 1、安装ssh

      % sudo apt-get install ssh

 2、确保ssh无密码登录

      % ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa   

 3、测试ssh

      % ssh localhost

  4、格式化HDFS文件系统

      % hadoop namenode -format       

  5、启动HDFS和MapReduce线程

       % start-dfs.sh

       % start-mapred.sh

 6、终止HDFS和MapReduce线程

      % stop-dfs.sh
      % stop-mapred.sh

 7、所有访问的文件需上传到HDFS文件系统,具体操作详见四。

四、伪分布式模式与全分布式模式需运行在HDFS文件系统

1、格式化HDFS文件系统

    hadoop namenode -format

2、上传资料到HDFS

    hadoop fs -put localsrc dest

3、浏览HDFS文件系统目录

     hadoop fs -ls

4、查看HDFS文件系统文件内容

    hadoop fs -cat filename

5、从HDFS文件系统下载文件

    hadoop fs -get dest localdest

6、帮助

    hadoop fs -help

7、删除文件

     hadoop fs -rm file



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值