下面我们从7个方面来对比离线数仓和实时数仓的区别:
1.架构选择方面,离线数仓采用传统大数据框架模式搭建,而实时数仓采用Kappa架构方式搭建。
2.建设方法上两者都是采用传统数仓建模方式论。
3.准确性方面,离线数仓准确性高,实时数仓随着技术发展,准确度也比较高。
4.实时性方面:离线数仓统计数据结果一般是T+1,实时数仓统计结果一般是分钟级别、秒级别。
5.稳定性方面:离线数仓稳定性好、方便重算。实时数仓对数据波动比较敏感,数据重新计算时相对麻烦。
6.数据吞吐量方面,离线数仓吞吐量都很高,实时数仓随着实时技术发展吞吐较高。
7.数据存储方面,离线数仓一般将数据存储在HDFS、Hive中,实时数仓一般将数据存储在kafak、Hbase.Redis、Clickhouse中。