Lambda架构与Kappa架构 区别

Lambda架构通过批处理层和速度层确保数据准确性和时效性,适合复杂机器学习场景。Kappa架构则简化为仅速度层,依赖数据保留策略实现重处理,适用于高实时性需求。选择取决于业务逻辑和对延迟的容忍度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

 

Lambda 架构:

Lambda 架构总共由三层系统组成的:批处理层(Batch Layer),速度处理层(Speed Layer),以及用于响应查询的服务层(Serving Layer)。

 

 

 

批处理层:
使用可处理大量数据的分布式处理系统预先计算结果。它通过处理所有的已有历史数据来实现数据的准确性。这意味着它是基于完整的数据集来重新计算的,能够修复任何错误,然后更新现有的数据视图。输出通常存储在只读数据库中,更新则完全取代现有的预先计算好的视图。

速度层:
通过提供最新数据的实时视图来最小化延迟。速度层所生成的数据视图可能不如批处理层最终生成的视图那样准确或完整,但它们几乎在收到数据后立即可用。而当同样的数据在批处理层处理完成后,在速度层的数据就可以被替代掉了。

总结:

批处理层保证数据的完整性和准确性,速度层保证数据的时效性,但是缺点是需要维护两套逻辑代码,维护较复杂,有没有可能在批处理中实现实时计算,或者在实时处理中实现批处理计算呢?于是就有了下面的kappa架构。

Kappa架构:

 

 

 

与 Lambda 架构不同的是,Kappa 架构去掉了批处理层这一体系结构,而只保留了速度层。你只需要在业务逻辑改变又或者是代码更改的时候进行数据的重新处理。

借用kafka的架构来说明kappa架构:

kafka可以通过设置来决定数据的保留时长,七天、一个月、或者永久保留,且kafka是通过offset来决定从哪里读取数据,因此当我们的业务逻辑改变时,需要从新读取所有历史数据时,只需要把offset设置为0即可。

总结:

1、如果你所面对的业务逻辑是设计一种稳健的机器学习模型来预测即将发生的事情,那么你应该优先考虑使用 Lambda 架构,因为它拥有批处理层和速度层来确保更少的错误。

2、如果你所面对的业务逻辑是希望实时性比较高,而且客户端又是根据运行时发生的实时事件来做出回应的,那么你就应该优先考虑使用 Kappa 架构。


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值