Flink在实时计算平台和实时数据仓库中的作用

本文探讨了Flink在实时计算平台中的应用,包括其架构、容错机制和反压处理。此外,文章还阐述了Flink在实时数据仓库中的优势,如状态管理、丰富的API和生态完善。美团的实时计算平台实例展示了Flink如何与其他组件(如Kafka、Redis和HBase)配合,构建实时数仓的分层架构。
摘要由CSDN通过智能技术生成

声明:本系列博客为原创,最先发表在拉勾教育,其中一部分为免费阅读部分。被读者各种搬运至各大网站。所有其他的来源均为抄袭。

《2021年最新版大数据面试题全面开启更新》

 

   当前基于Hadoop的离线存储体系已经足够成熟,但是离线计算天然时效性不强,一般都是隔天级别的滞后,业务数据随着实践的推移,本身的价值会逐渐减少。越来越多的场景需要使用实时计算,这种背景下实时计算平台的需求应运而生。

架构选型

     首先在架构上,Flink采用经典的主从模式,DataFlow Grapy和Storm形成的Topology结构类似,Flink程序启动后,会根据用户的代码处理成Stream Grapy,然后优化成为JobGrapy,JobManager会根据JobGrapy生成ExecutionGrapy。ExecutionGrapy才是Flink真正能执行的数据结构,当很多个ExecutionGrapy分布在集群中,就会形成一张网状的拓扑结构。

     其次在容错方面,针对以前Spark Streaming任务,可以配置对应的checkpoint,也就是保存点(检查点)。当任务出现failover的时候,会从checkpoint重新加载,使得数据不丢失。但是这个过程会导致原来的数据重复使用,不能做到“只处理一次”的语义。Flink基于两阶段提交实现了端到端的一次处理语义。

     在任务的反压上,Flink没有使用

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

王知无(import_bigdata)

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值