java Flink（二）数据流处理demo

最新推荐文章于 2023-04-12 15:02:19 发布

小菜菜1223

最新推荐文章于 2023-04-12 15:02:19 发布

阅读量665

点赞数

分类专栏： Java Flink Java 文章标签： Flink 流处理 WordCount 数据处理实时计算

本文链接：https://blog.csdn.net/qq_40771567/article/details/115125988

版权

Java 同时被 2 个专栏收录

97 篇文章 7 订阅

订阅专栏

Java Flink

45 篇文章 26 订阅

订阅专栏

上文介绍的是数据批处理，可以简单理解为就是一批固定的数据

数据流处理的意思是，有源源不断的数据，来一个数据进行以此处理。

还是一样的分词处理，这次用流处理方式，直接上代码（文件看上文）

import org.apache.flink.api.java.DataSet;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

public class StreamWordCount {
    public static void main(String[] args) throws Exception{
        //创建流处理环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        //设置并行度
        //env.setParallelism(8);
        //从文件中读取数据
        String inputPath = "D:\\idle\\FlinkTest\\src\\main\\resources\\word.txt";
        DataStream<String> inputDataStream = env.readTextFile(inputPath);
        //基于数据流进行转换 new WordCount.MyflatMapper()上文写好的flatMap
        DataStream<Tuple2<String,Integer>> resultStream = inputDataStream.flatMap(new WordCount.MyflatMapper()).keyBy(0)//按照当前key的hashcode进行重分区
                .sum(1);
        resultStream.print();
        //执行任务 启动任务
        env.execute();
    }
}

小菜菜1223

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java Flink（二）数据流处理demo

上文介绍的是数据批处理，可以简单理解为就是一批固定的数据数据流处理的意思是，有源源不断的数据，来一个数据进行以此处理。还是一样的分词处理，这次用流处理方式，直接上代码（文件看上文）import org.apache.flink.api.java.DataSet;import org.apache.flink.api.java.tuple.Tuple2;import org.apache.flink.streaming.api.datastream.DataStream;import
复制链接

扫一扫

专栏目录