Spark系列十六:Spark Streming

实时计算相关技术比较

Strom / Jstrom

    Spark Streming    

  Flink    

   实时性高      

    有延迟       

     实时性高

   吞吐量较低     

   吞吐量高     

     吞吐量高

   只能实时计算   

   离线+实时  

     离线+实时

   算子比较少      

   算子丰富   

     算子丰富

      没有        

   机器学习              

      没有

      没有                

    图计算 

      没有

   使用比较少        

   非常火    

      一般

一个完整的生态是非常重要的,spark生态特别完善

DStream

  1. Spark Streaming是一个基于Spark Core之上的实时计算框架,可以从很多数据源消费数据并对数据进行处理,
  2. 在Spark Streaming中有一个最基本的抽象叫DStream(代理)
  3. DStream本质上就是一系列连续的RDD,DStream其实就是对RDD的封装
  4. DStream可以任务是一个RDD的工厂,该DStream里面生产都是相同业务逻辑的RDD,只不过是RDD里面要读取数据的不相同
  5. 深入理解DStream:他是sparkStreaming中的一个最基本的抽象,代表了一系列连续的数据流,本质上是一系列连续的RDD,你对DStream进行操作,就是对RDD进行操作
  6. DStream每隔一段时间生成一个RDD,你对DStream进行
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值