kappa架构的层级及其特点

最新推荐文章于 2024-07-21 03:04:24 发布

初心江湖路

最新推荐文章于 2024-07-21 03:04:24 发布

阅读量3.9k

点赞数 3

分类专栏：大数据文章标签：大数据 kappa架构

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43878293/article/details/103804262

版权

kappa架构依赖流处理系统处理大数据，包括消息传输层和流处理层。消息传输层提供持久性、分布式、可重放和高性能；流处理层要求低延迟、高吞吐和一致性保证。常用的消息传输层工具是Kafka，流处理引擎有Spark Streaming、Flink和Storm。Flink在延迟和一致性上优于Spark。kappa架构强调幂等性和Exactly-once语义，简化了系统维护，但也存在从头计算的不足。

摘要由CSDN通过智能技术生成

kappa架构的本质可以说是只依赖一套流处理系统来作为大数据处理解决方案。

一、概括起来，kappa架构包括两个层级

1、消息传输层

这一层有如下特点

持久性------数据可任意设定存储时间
分布式------数据分布式存储
数据可重放------数据可以被replay，从头重新处理
高性能------能够提供高性能数据读写访问

有了这几点保证之后，数据便可以在某个需要限度内全量存储，这可将生产者和消费者解耦，并进行分布式容错以提高可用性，可重放很重要，这确保了在必要情况下系统可进行重算。

消息传输层的意义在于弹性容纳并提供流计算引擎的输入数据，并在必要时从头开始读取重新计算，从而获得可靠结果。

通常使用消息队列如Kafka来作为消息传输层。

2、流处理层

这一层即是大数据流处理引擎，可用于进行流分布式实时计算。理想情况下，流处理层也应该具备如下特点

低延迟------保证快速响应
高吞吐------同时处理庞大数据量
具

最低0.47元/天解锁文章

初心江湖路

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。