批处理(batch computing)
对一定规模量的数据进行处理,类比搬砖,10个10个的搬
场景:离线数据统计,报表分析等
特点:批量计算非实时,高延迟,计算完成后才可以得到结果 。
框架:Hadoop Mapreduce
流处理(stream computing):
对源源不断的数据流进行处理,类似水龙头出水
场景:实时监控,实时风控等
特点:流式计算实时,低延迟,实时取最新的结果
框架:Spark(宏观上),Flink
批处理(batch computing)
对一定规模量的数据进行处理,类比搬砖,10个10个的搬
场景:离线数据统计,报表分析等
特点:批量计算非实时,高延迟,计算完成后才可以得到结果 。
框架:Hadoop Mapreduce
流处理(stream computing):
对源源不断的数据流进行处理,类似水龙头出水
场景:实时监控,实时风控等
特点:流式计算实时,低延迟,实时取最新的结果
框架:Spark(宏观上),Flink