Hadoop——从Hadoop框架讨论大数据生态(二)

2.5.3 MapReduce 框架概述
MapReduce 将计算过程分为两个阶段:Map和Reduce
1)Map阶段并行处理输入数据
2)Reduce阶段对Map结果进行汇总
2.6 大数据技术生态体系
数据来源层:
数据库(结构化数据)
文件日志(半结构化数据)
视频、ppt等(非结构化数据)
数据传输层:
Sqoop数据传递
Flume日志收集
Kafka消息队列
数据存储层:
HDFS文件存储
HBase非关系型数据库
Kafka消息队列
资源管理层:
YARN资源管理
数据计算层:
MapReduce离线计算(离线)Hive数据查询 Mahout数据挖掘
Spark Core内存计算 (离线 数据容易丢失)Mahout数据挖掘 Spark Mlib数据挖掘 Spark R数据分析 Spark Sql数据查询 Spark Streaming实时计算
Flink (离线)
任务调度层:
Oozie任务调度 Azkaban任务调度
//容易改变的信息放在zookeeper里 zookeeper数据平台配置和调度
业务模型层;
业务模型、数据可视化、业务应用在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值