Hadoop权威指南(第4版)-OReilly 2016 读书笔记

这篇博客是《Hadoop权威指南》第四版的读书笔记,涵盖了Hadoop的基本概念,包括MapReduce的工作机制、HDFS、YARN以及Hadoop生态中的组件如Hive、HBase和ZooKeeper。深入探讨了MapReduce的应用开发、I/O操作、Hadoop集群构建和管理,以及各种工具如Flume、Sqoop和Pig的使用。同时还分享了实际案例,展示了Hadoop在生命数据科学中的应用。
摘要由CSDN通过智能技术生成

Hadoop权威指南(第4版)-OReilly 2016-ReadingNotes.md

初识Hadoop

关于MapReduce

  • mapper和reducer
  • combiner*

HDFS

  • p48 Hadoop2: HA,备用namenode
  • 2种HA共享存储:
    • NFS过滤器
    • QJM(quorum journal manager)
  • p73 副本怎么放
    • 由近到远随机放(注意,hadoop不使用DHT机制,靠的是namenode的索引维护)

YARN

  • p83 MapReduce 1 vs YARN
    • RM -> NM(管理监控容器):YARN vs k8s vs Mesos?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值