Hadoop

Hadoop生态圈

HDFS:Hadoop Distributed File System作为Hadoop生态体系中数据的存储,分布式文件系统

MapReduce:Hadoop中分布式计算框架,对海量数据进行并行分析和计算

Hbase:基于HDFS的列式存储的Nosql数据库

Hive:是一款SQL解释引擎,能够将Sql转换成为MR代码

Flume:分布式日志采集系统,用于收集海量的日志数据,并将其存储在HDFS中

Kafka:消息队列,实现对分布式应用程序间的解耦和,数据缓冲

Zookeeper:分布式协调服务,用户注册中心,配置中心,集群选举,状态检测,分布式锁

Yarn:通用的资源管理系统

大数据的分析方案

MapReduce:大数据离线批处理(基于磁盘,延迟比较高)

Spark:大数据离线批处理(基于内存,相对于MR速度快很多)

Storm/Spark Streaming/Kafka Streaming/Flink:实时流处理框架,达到对记录级别消息的毫秒级处理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值