我的第一个Flink程序-WordCount

最新推荐文章于 2024-08-06 10:35:08 发布

泡泡茶壶

最新推荐文章于 2024-08-06 10:35:08 发布

阅读量221

点赞数

分类专栏： Flink程序文章标签： flink

本文链接：https://blog.csdn.net/qq_25822601/article/details/107313732

版权

Flink程序专栏收录该内容

1 篇文章 0 订阅

订阅专栏

我的第一个Flink程序-WordCount

创建项目

创建项目

1.创建一个新的项目
在这里插入图片描述

package com.atttttt

//导入一些隐式类型转换，implicit
import org.apache.flink.streaming.api.scala._

object WordCount {
	
	case class WordWithCount(word : String , count : Int)
	
	def main(args : Array[String]) : Unit = {
		// 获取运行时环境，类似SparkContext
		val env = StreamExecutionEnvironment.getExecutionEnvironment
		// 设置分区（又叫并行任务）的数量为1
		env.setParallelism(1)

		// 建立数据源
		// 需要先启动'nc -lk 9999'，用来发送数据
		val stream = env.socketTextStream("hadoop102",9999,'\n')
		
		// 写对流的转换处理逻辑
		val transformed = stream
			// 使用空格切分输入的字符串
			.flatMap(line=>line.split(" "))
			// 类似与MR中map
			.map(w => WordWithCount(w,1))
			// 使用word字段进行分组，shuffle
			.keyBy(0)
			// 开了一个5s的滚动窗口
			.timeWindow(Time.seconds(5))
			// 针对count字段进行累加操作，类似MR中的reduce
			.sum(1)

		// 将计算结果输出到标准输出
		transformed.print()

		//执行计算逻辑
		env.execute()
	}
}