Flink DataStream之min()与minBy()，max()与maxBy()区别详解

最新推荐文章于 2023-12-03 20:53:30 发布

Aimo_Hassa

最新推荐文章于 2023-12-03 20:53:30 发布

阅读量2.1k

点赞数 1

分类专栏：大数据技术之Flink 文章标签：大数据 flink big data 实时大数据

本文链接：https://blog.csdn.net/k_kuo_k/article/details/121564658

版权

在Flink中有一类滚动聚合的算子（Rolling Aggregation）：

sum()、min()、minBy()、max()、maxBy()

其中，对于min()和minBy()，max()和maxBy()之间的区别，具体如下：

1、处理的数据只有两个字段：

即：只有分组字段和比较字段，

如城市温度数据(city，temp)，其中city用来分组（keyBy），temp用来比较（min/minBy），

那么，此时min()和minBy()的作用是一样的，都是得到比较字段的最小值。案例代码如下：读者也可以自己写个demo测试一下。

public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        conf.setString("rest.port","8091");
        StreamExecutionEnvironment env = StreamExecutionEnvironment.createLocalEnvironmentWithWebUI(conf);
        //从端口号获取数据
        DataStreamSource<String> dataSource = env.socketTextStream("10.12.36.102", 8888);

        //=========================两个字段==============
        //将数据转化为Tu