三、实时数仓的应用场景 四、如何建设实时数仓 4.1 实时数仓的整体的架构图 数仓层次更少 尽量减少层次的划分,应用层数据直接写入应用数据库,仓库内不维护应用层。 多种数据源存储 实时数仓使用Kafka存储明细与数据汇总数据,Tair、Hbase等缓存存储维度数据。 4.2 ODS层的建设 数据来源尽可能统一 利用分区保证数据局部有序 4.3 DW层的建设 解决原始数据中数据存在噪声、不完整和数据形式不统一的情况。形成规范,统一的数据源。如果可能的化尽可能和离线保持一致。