1.Hadoop来源
hadoop来源于Google核心技术。
分布式基础设施 :GFS、Chubby和Protocol Buffer
分布式大规模数据处理:MapReduce、Sawzall
分布式数据库:BigTable和Sharding BitTable对应HBase
1.1GFS的架构
Master 存储数据块信息 双重Master不存在单点问题
Chunkserver存放数据分片信息,会和Master通信确认是否可访问
1.2 MapReduce架构
MapReduce是把一个大的任务分成多个小的任务
UserProgram进程分出一个Master进程管理Mapwork和Reducework。master进程负载