大数据架构演变

本文探讨了大数据架构从传统离线处理到Lambda、Kappa架构的演变,以及湖仓一体实时数仓架构的出现。内容包括各架构的优缺点,如Lambda架构的实时链路与离线数仓,Kappa架构的批流统一,以及如何根据业务需求选择合适的大数据架构。
摘要由CSDN通过智能技术生成

一、传统离线大数据架构

在这里插入图片描述

一般在刚引入大数据架构是开始使用,比较适合做批量处理,T+1数据处理等

优点是做批量计算性能比较高,特别适合做批量数据的聚合分析计算。

缺点:这种架构不好支持实时业务数据的开发。一般这种离线数仓分层计算之间都是通过Mapreduce/SparkSQL做批量处理来实现聚合分析,除了数据落库的磁盘IO等比较慢以外,还有一点就是批处理是需要数据来了以后等待一会,聚集一批数据在处理,这样数据从头到尾下来就需要等待和处理较长的时间。而对于一些对实时性要求高的数据来说,这种滞后性是无法容忍的。

二、Lambda架构(离线处理+实时链路)-传统实时开发

在这里插入图片描述

从原有离线处理架构的基础上加上了实时处理链路部分,实现了实时业务数据的处理。

对于批处理任务,还是使用原有的传统离线架构不变,支持高性能的离线批处理。

对于实时性要求比较高的场景和需求,单独采用实时链路进行开发,数据流过来了能直接处理,而不需要积累一定的时间或量级再进行处理,尽可能的提高数据从流入到结果产出的时间效率。
缺点:实时链路的业务数据处理是烟囱式的开发,不能对实时链路处理的中间结果做复用处理,每一个

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值