与Spark不同的是,Flink不但能做真正的流式计算,还能完成批计算,达到了很厉害的流批一体。
开启流批一体的方法为,在flink流环境中设置为批处理模式
当我们执行wordcount案例时,会出现一个有趣的现象,就是开启批处理后,出现频率为1的单词,不会被统计。这是因为,批处理拿到一批数据时,sum算子底层调用的reduce方法如果执行则要求至少两个数据相加才行,那么出现频率为1的单词,由于没法sum计算,则不会被统计。
与Spark不同的是,Flink不但能做真正的流式计算,还能完成批计算,达到了很厉害的流批一体。
开启流批一体的方法为,在flink流环境中设置为批处理模式
当我们执行wordcount案例时,会出现一个有趣的现象,就是开启批处理后,出现频率为1的单词,不会被统计。这是因为,批处理拿到一批数据时,sum算子底层调用的reduce方法如果执行则要求至少两个数据相加才行,那么出现频率为1的单词,由于没法sum计算,则不会被统计。