Spark Streaming 实时流处理总结

1.实时流处理项目 流程图

日志收集框架Flume--->消息队列Kafka--->Spark Streaming--->HBase--->数据处理结果可视化。

实时流处理适用场景:时效性高  数据量大

离线计算和实时计算对比:

数据来源离线实时
处理过程HDFS 历史数据 数据量大消息队列(kafka),实时记录变化的数据
处理速度MapReduce:map + reduceSpark Streaming storm flink(Stream)
进程启动+销毁 实时在线

 

实时流处理架构与技术选型

13145004_ADDm.jpg

转载于:https://my.oschina.net/mrpei123/blog/1927007

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值