前言
基于StarRokcs构建流批一体的数仓架构体系,在本期需要引入离线变更数据及实时新增数据的同步策略,以满足上层各业务场景下的看板需求。
一、业务介绍
目前全农码离线数仓实现了 31省6大业务系统,近75亿涉农要素的数据汇集、数据关联分析、数据打通及给应用侧推送赋码主体数据,支撑全农码驾驶舱5大类模块的数据分析需求。
二、当前架构及痛点
2.1 当前架构
当前架构是以StarRocks为底座构建了离线数仓架构,作为极速性能的OLAP引擎,StarRocks实现算存一体、查询分析统一。如上图,数据流转链路大致为:利用datax对业务库中的快照数据进行全量同步,在StarRocks内部做数据的逻辑分层,分别是ODS、DWD层以及ADS层,以实现