Blink学习(四):数据流

本文是Blink学习系列的第四部分,主要介绍数据流的概念。文章对比了Blink与Storm的API,指出Blink更注重“面向数据”,适合工程实践。内容包括API概述,如DataStream的定义和配置;DataStream操作简介,提供了简单的操作示例和丰富的计算抽象;物理分组的讨论,以及API层次的解析。
摘要由CSDN通过智能技术生成

Blink学习(四):数据流

1 API概述

DataStream是Blink对数据流进行的的抽象。每个数据流都需要指定一个数据源,并可以调用接口对数据流进行命名、配置并行度配置堆栈内存等。

对比storm的API,blink的API更多的是“面向数据”,而storm更多的是“面向操作”。storm的好处在于操作的定义非常灵活、精准,因此在学术界storm仍被广泛使用。blink的特点是开发效率高,因此在工程界使用较多。
在这里插入图片描述
简单定义一个DataStream的例子如下:

 DataStream<TTLogBlock> dataStream = env
                .addSource(p4p_pv2_source)
                .
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值