实时存储引擎和实时计算引擎

本文主要探讨了实时存储引擎Kafka和实时计算引擎Flink。Kafka用于实时存储,解决延迟消费问题。Flink作为实时计算引擎,提供流处理和批处理能力,强调状态管理和窗口计算。Flink的HA新架构基于YARN,通过ZK进行协调。文章还讨论了Flink作业的编译、部署以及与Spark的对比,并解答了关于消费保证、Kafka扩容、实时与批数据对齐等问题。
摘要由CSDN通过智能技术生成

系列文章

  1. 实时存储引擎和实时计算引擎
  2. 美团点评 Hadoop/Spark 系统实践
  3. 美团大数据查询技术
  4. 美团深度学习平台实践
  5. 美团广告系统实践

一 、实时存储引擎 Kafka


SSD 缓存架构解决延迟消费污染缓存空间问题

二 、实时计算引擎 Flink

2.1 简介和系统架构

相当于 mapreduce/spark + 实时计算

在这里插入图片描述
在实时处理框架中,不会持久化,而是写入内存的一个 state,通过写入内存替代持久化,增加处理速度。
最近两年使用 streaming,Flink,生态比较好。
在这里插入图片描述
native 单条
micro-batch 微批

评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值