支持spark_自从flink成熟之后,spark是否慢慢成为鸡肋?

Spark 并没有止步不前。

Spark 和 Flink 两个项目的核心 API 基本一致,Spark 在机器学习整合方面投入更多,Flink 在流处理方面更赞(这也是大家在 2016 年开始关注 Flink 的原因),当然二者最大的区别,也还在于对流式计算的支持。这句的潜在含义就是 Spark 存在的道理:尽管 Spark Steaming 现在和 Flink 相比优势不显,但它的生态更为丰富,除了 Streaming 还有 SQL、MLib、Graphx 等,同时目前 Spark 对 Kubernetes 云原生技术的原生支持更加到位

网易猛犸大数据平台,在流计算也采用基于 Flink 研发的 Sloth,支持使用 SQL 开发流式计算任务,兼容离线 SQL,可实时分析用户的访问数据,展示流量变化和用户分布情况。但是但是但是,我们在计算层并没有放弃支持 Spark ,就是因为上面的道理。

be58e89b1b397c133ecc3647c967c4a3.png

8c5566a329a649fc32e65ffa835991cf.png

再看 Spark 在流计算方面的努力,它从 2.0 开始引入了 Structured Streaming,重新整理流计算的语义,使用微批(Micro-Batch)处理执行模型,支持按事件时间处理和端到端的一致性,并在 2.3 实现了 初始的持续处理(Continuous Processing)。根据官方介绍,Spark 执行引擎未来的发展会和 Flink 类似。这并不是最新的消息,很多功能还比较初级,但 Spark 早有规划,相信 Spark 凭借比 Flink 更为成熟的社区,会给出一个令人惊喜的答案。

b5bfda3bb561378ce699281a69295866.png

cf5cb027d120189addb23293f88b4ce8.png

f245bc4c39569fbbb9af6c17b33f476e.png

5e432244e0ef7ef6f22e84aa5f327391.png

7072217a1ca254894f73e4c01b181369.png

49dd97668a43e168fc29413cbba76f86.png

8481f471842e99f6b95bd41c97fe471c.png

ff39cb5addd05939df53bdb91495030c.png

2048cad22237ec1a88529d25ed67e7c4.png

777a110d35e21a7367dffaef88b2c6df.png

更多详情请参考官方博客与视频:

Introducing Low-latency Continuous Processing Mode in Structured Streaming in Apache Spark 2.3

Continuous Processing in Structured Streaming

作者:网易云

链接:https://www.zhihu.com/question/306432813/answer/568585759

来源:知乎

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值