在2014年的Google I/O大会上,Google宣布已经停用MapReduce,专项支持新的超大规模云分析系统,这都是Cloud Dataflow,Cloud Dataflow用于构建移动应用,调试、追踪和监控产品级云应用,它是一种构建、管理和优化复杂数据流水线的方法。它主要采用了Google内部的Flume和MillWhell技术,其中Flume用于数据的高效率并发处理,而MillWhell则用于互联网级别的带有很好容错机制的流处理。
架构图如下所示:
在2014年的Google I/O大会上,Google宣布已经停用MapReduce,专项支持新的超大规模云分析系统,这都是Cloud Dataflow,Cloud Dataflow用于构建移动应用,调试、追踪和监控产品级云应用,它是一种构建、管理和优化复杂数据流水线的方法。它主要采用了Google内部的Flume和MillWhell技术,其中Flume用于数据的高效率并发处理,而MillWhell则用于互联网级别的带有很好容错机制的流处理。
架构图如下所示: