三大组件
程序猿小飞
做好自己该做的事。
展开
-
hadoop三大组件的简单图解
转载 2018-12-21 15:11:14 · 1158 阅读 · 0 评论 -
一、初始Hadoop之一Hadoop三大组件
一、Hadoop的组件: 1、HDFS 一个高可靠、高吞吐量的分布式文件系统 存储海量数据 分布式 安全性 副本数据 数据是以block的方式进行存储的,128M 比如:200M—128M 72M 2、MapReduce 一个分布式的离线并行计算框架 对海量数据的处理 分布式 思想: 分而治之 大数据集分为小的数据集 每个数据集进行逻辑业务处理(map) 合并统计数据结果(reduce) 3、Y...原创 2018-12-21 15:42:11 · 7560 阅读 · 0 评论