2021-04-19

初识实时数据流

一、离线计算与实时计算的对比

主要从以下四个方面
1)数据来源
离线:HDFS 历史数据 数据量较大
实时:消息队列(kafka)
2)处理过程
离线:MapReduce:map+reduce
实时:spark(DStream/ss)
3)处理速度
离线:慢
实时:快速
4)进程
离线:启动+销毁
实时:7*24小时

二、实时流处理框架对比
Apache storm:免费开源分布式
Apache Spark Streaming:按照时间间隔
IBM Streaming
Yahoo!S4
Linkedin Kafka
Flink

三、实时流处理架构与技术选型
实时流处理架构图
四、实时流处理在企业中的应用

①电信行业
例如:实时计算剩余流量,发送短信进行提醒
②电商行业
例如:推荐系统的实时计算推荐

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值