Apache Beam初探

Apache Beam

Apache Beam provides an advanced unified programming model, allowing you to implement batch and streaming data processing jobs that can run on any execution engine.

Apache Beam is:

  • UNIFIED - Use a single programming model for both batch and streaming use cases.
  • PORTABLE - Execute pipelines on multiple execution environments, including Apache Apex, Apache Flink, Apache Spark, and Google Cloud Dataflow.

  • EXTENSIBLE - Write and share new SDKs, IO connectors, and transformation libraries.
原文地址:https://beam.apache.org/

从定义上看,Apache Beam是一个增强型的统一编程模型,这个模型可以支持实现batch和streaming 数据处理工作,并且可以运行在任何执行引擎上。所以总结Apache Beam的特点为:
1、可以针对batch and streaming use cases使用一个编程模型;
2、可以在多个执行环境上执行pipeline,包括了当前比较流行的Apache Apex,Apache Flink,Apache Spark,和Google Cloud Dataflow。
3、可扩展,可以编写和共享新的SDKs,IO connectors,和transformation 库。

分析看来,Apache Beam是提供了一个统一的编程模型,或者说是为客户提供了一个统一的接口,让用户可以不再关心batch和steaming data的不同处理,让用户可以不再关心具体的执行环境或者执行引擎。
这个图更能说明Apache Beam做了什么:

如果Apache Beam真能发展壮大,那么针对大数据处理,无疑是提供了一个很好的解决方案,让用户省去了很多麻烦事。目前sdk仅仅能支持Java版本。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值