[flink]#12_Data Stream

  • DataSource:数据源输入,
  • Transformation:具体操作,Map,Flatmap,Filter
  • Sink:处理后数据存入指定介质

DataSource

  1. 基于文件
    readTextFile(path)

  2. 基于Socket
    socketTextStrean

  3. 基于集合
    fromCollection(Collection)

  4. 自定义输入

Transformation

  • Map:

  • FlatMap:

  • Filter:

  • KeyBy:根据指定的key分组

  • Reduce:对数据进行聚合操作

  • Aggregations:sum(), max(), min()等

  • Union:合并多个流,所有流类型必须一致

  • Connect:合并两个流,流类型可不同

  • coMap,coFlatMap

  • Split:把一个数据流分为多个流

  • Select:选择Split后的流

  • Random partitioning:随机分区
    DataStream.shuffle()

  • Rebalancing:对数据集再平衡,重分区,消除数据倾斜
    DataStream.rebalance()

  • Rescaling:重新调节
    DataStream.rescale()

  • Custom partitioning:自定义分区
    DataStream.partitionCustom(partitioner, "someKey")
    DataStream.partitionCustom(partitioner, 0)

Sink

  • writeAsText()

  • print(), printErr()

  • 自定义输出:addSink数据输出到第三方存储介质

  • 自定义Sink:实现SinkFuction接口;继承RichSinkFunction类

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值