hadoop知识总结(面试)

  • 简述hadoop1.2.0的安装步骤
    1. 安装ssh(免登陆)
    2. 配置hosts文件(IP、名称的映射)
    3. 分发到各个节点
    4. 安装JDK 配置环境变量(1.6x版本)
    5. 安装hadoop并修改配置文件
      1. hadoop-env.xml(JDK)
      2. core-site.xml(namenode配置)
      3. hdfs-site.xml(hdfs配置)
      4. mapred-site.xml(jobtracker配置)
    6. 指定master(masterclone)和slaves
    7. 分发JDK、hadoop相关配置
    8. 格式化namenode
  • Hadoop的核心模块和相应的进程
    • Hdfs: NameNode、SecondaryNameNode、DataNode
    • Mapreduce: ResourceManager、NodeManager
  • SecondaryNameNode的作用
    • 它不是namenode的冗余守护进程,而是提供周期检查点和清理任务。动态合并NameNode的EDITS文件和images文件
  • Edits和fsimages文件的作用
    • Fsimages记录namenode的元数据信息。
    • Edits记录当前操作的元数据。
  • 结合图描述hdfs写原理
  • 流程分析
    • 使用HDFS提供的客户端开发库Client,向远程的Namenode发起RPC请求;
    • Namenode会检查要创建的文件是否已经存在,创建者是否有权限进行操作,成功则会为文件创建一个记录,否则会让客户端抛出异常;
    • 当客户端开始写入文件的时候,会将文件切分成多个packets,并在内部以数据队列“data queue”的形式管理这些packets,并向Namenode申请新的blocks,获取用来存储replicas的合适的datanodes列表,列表的大小根据在Namenode中对replication的设置而定。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值