第一个FLINK程序之WordCount

该博客展示了如何使用Apache Flink进行实时流处理,通过Socket读取数据,实现WordCount案例。代码中定义了数据类型WordWithCount,设置并行度,从Socket读取文本流,进行数据转换,包括单词切分、映射、按单词分组、时间窗口化和求和操作,最后将结果打印并执行计算。
摘要由CSDN通过智能技术生成
package com.atguigu.day1

import org.apache.flink.streaming.api.scala._
import org.apache.flink.streaming.api.windowing.time.Time

/**
 * @author :ZCB
 * @date :Created in 2021/8/10 23:01
 * @desc:
 */
object WordCountFromSocket {
  case class WordWithCount(value: String, i: Int)

  def main(args: Array[String]): Unit = {
    //获取运行时环境,类似于SparkContext
    val env = StreamExecutionEnvironment.getExecutionEnvironment
    //设置分区(又叫并行任务)的数量为1
    env.setParallelism(1)

    //建立数据源

    val stream = env.socketTextStream("localhost", 9999, '\n')

    //写对流的转换处理逻辑
    val transformed = stream
      //使用空格切分输入的字符串
      .flatMap(line => line.split("\\s"))
      //类似MR中的map
      .map(w => WordWithCount(w, 1))
      //使用word字段进行分区,shuffle
      .keyBy(0)
      //开了一个5s的滚动窗口
      .timeWindow(Time.seconds(5))
      //针对count字段进行累加操作
      .sum(1)

    //将计算的结果输出到标准输出
    transformed.print()
    //执行计算逻辑
    env.execute()
  }
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值