kappa架构的层级及其特点

kappa架构依赖流处理系统处理大数据,包括消息传输层和流处理层。消息传输层提供持久性、分布式、可重放和高性能;流处理层要求低延迟、高吞吐和一致性保证。常用的消息传输层工具是Kafka,流处理引擎有Spark Streaming、Flink和Storm。Flink在延迟和一致性上优于Spark。kappa架构强调幂等性和Exactly-once语义,简化了系统维护,但也存在从头计算的不足。
摘要由CSDN通过智能技术生成

kappa架构的本质可以说是只依赖一套流处理系统来作为大数据处理解决方案。

一、概括起来,kappa架构包括两个层级

1、消息传输层

这一层有如下特点

  • 持久性------数据可任意设定存储时间
  • 分布式------数据分布式存储
  • 数据可重放------数据可以被replay,从头重新处理
  • 高性能------能够提供高性能数据读写访问

有了这几点保证之后,数据便可以在某个需要限度内全量存储,这可将生产者和消费者解耦,并进行分布式容错以提高可用性,可重放很重要,这确保了在必要情况下系统可进行重算。

消息传输层的意义在于弹性容纳并提供流计算引擎的输入数据,并在必要时从头开始读取重新计算,从而获得可靠结果。

通常使用消息队列如Kafka来作为消息传输层。

2、流处理层

这一层即是大数据流处理引擎,可用于进行流分布式实时计算。理想情况下,流处理层也应该具备如下特点

  • 低延迟------保证快速响应
  • 高吞吐------同时处理庞大数据量
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值