Hadoop——从Hadoop框架讨论大数据生态(二)

最新推荐文章于 2024-10-24 17:07:56 发布

Jynyiu

最新推荐文章于 2024-10-24 17:07:56 发布

阅读量118

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/apiece1/article/details/107407628

版权

2.5.3 MapReduce 框架概述
MapReduce 将计算过程分为两个阶段：Map和Reduce
1）Map阶段并行处理输入数据
2）Reduce阶段对Map结果进行汇总
2.6 大数据技术生态体系
数据来源层：
数据库（结构化数据）
文件日志（半结构化数据）
视频、ppt等（非结构化数据）
数据传输层：
Sqoop数据传递
Flume日志收集
Kafka消息队列
数据存储层：
HDFS文件存储
HBase非关系型数据库
Kafka消息队列
资源管理层：
YARN资源管理
数据计算层：
MapReduce离线计算（离线）Hive数据查询 Mahout数据挖掘
Spark Core内存计算（离线数据容易丢失）Mahout数据挖掘 Spark Mlib数据挖掘 Spark R数据分析 Spark Sql数据查询 Spark Streaming实时计算
Flink （离线）
任务调度层：
Oozie任务调度 Azkaban任务调度
//容易改变的信息放在zookeeper里 zookeeper数据平台配置和调度
业务模型层;
业务模型、数据可视化、业务应用在这里插入图片描述

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。