Blink学习(四):数据流
1 API概述
DataStream是Blink对数据流进行的的抽象。每个数据流都需要指定一个数据源,并可以调用接口对数据流进行命名、配置并行度配置堆栈内存等。
对比storm的API,blink的API更多的是“面向数据”,而storm更多的是“面向操作”。storm的好处在于操作的定义非常灵活、精准,因此在学术界storm仍被广泛使用。blink的特点是开发效率高,因此在工程界使用较多。
简单定义一个DataStream的例子如下:
DataStream<TTLogBlock> dataStream = env
.addSource(p4p_pv2_source)
.