Kappa
=================================================================
Kappa架构原理
Kappa架构的核心思想包括以下三点:
-
用Kafka或者类似的分布式队列系统保存数据,你需要几天的数据量就保存几天。
-
当需要全量重新计算时,重新起一个流计算实例,从头开始读取数据进行处理,并输出到一个新的结果存储中。
-
当新的实例做完后,停止老的流计算实例,并把老的一些结果删除。
在Kappa架构下,只有在有必要的时候才会对历史数据进行重复计算,并且实时计算和批处理过程使用的是同