flink2-有界流计算wordcount

流式处理分为有界流和无界流
1)有界流
有界流就是读取的数据是有界限的,在流不关闭的情况下,能读取到数据的尽头
2)无界流
在人为不干预的情况下,流一直在,不会停,数据没有边界

package day01;


import org.apache.flink.api.common.functions.MapFunction;
import org.apache.flink.api.java.functions.KeySelector;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.KeyedStream;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

public class Flink02_wordCount_Bounded {
    public static void main(String[] args) throws Exception {
        //流式处理,有界流
        //获取执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(1);
        //读取文件
        DataStream<String> DS = env.readTextFile("input");
        //对每行数据进行flatMap
        SingleOutputStreamOperator<String> words = DS.flatMap(new Flink01_wordcount_batch.MyFlatMap());
        //改变每个单词的结构:word->(word,1)
        SingleOutputStreamOperator<Tuple2<String, Integer>> wordToOne = words.map(new MapFunction<String, Tuple2<String, Integer>>() {
            @Override
            public Tuple2<String, Integer> map(String s) throws Exception {
                return new Tuple2<>(s,1);
            }
        });
        //按照key进行分组,但是在流处理中,没有groupBy,有keyBY,需要传入KeySelector对象,输入参数是tuple2,输出只要key进行分组就行
        KeyedStream<Tuple2<String, Integer>, String> wordGroup = wordToOne.keyBy(new KeySelector<Tuple2<String, Integer>, String>() {
            @Override
            public String getKey(Tuple2<String, Integer> stringIntegerTuple2) throws Exception {
                return stringIntegerTuple2.f0;
            }
        });
        //将分组好的数据进行聚合
        SingleOutputStreamOperator<Tuple2<String, Integer>> result = wordGroup.sum(1);
        //打印结果
        result.print();
        //开启流
        env.execute("wordcount");


    }
}

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值