flink wordcount demo

最新推荐文章于 2023-03-06 15:12:56 发布

H.King

最新推荐文章于 2023-03-06 15:12:56 发布

阅读量454

点赞数

分类专栏： flink 文章标签： flink

本文链接：https://blog.csdn.net/github_37643896/article/details/106117297

版权

flink 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

demo

package com.hbn.wc

import org.apache.flink.api.scala.{DataSet, ExecutionEnvironment}

import org.apache.flink.api.scala._


object WordCount {
  def main(args: Array[String]): Unit = {

    //获取执行环境
    val env = ExecutionEnvironment.getExecutionEnvironment

    //加载数据源
    //val inputData = env.fromElements("china is the best country","beijing is the capital of china")

    val  inputData:DataSet[String] = env.readTextFile("/Users/H/Code/flinklearning/src/main/resources/wordcount.txt")
    //转化处理数据
    val result:DataSet[(String ,Int)] = inputData.flatMap(_.split(" ")).map((_,1)).groupBy(0).sum(1)

    //输出至目的端
    result.print()

    // 执行操作
    // 由于是Batch操作，当DataSet调用print方法时，源码内部已经调用Excute方法，所以此处不再调用，如果调用会出现错误
    //env.execute("Flink Batch Word Count By Scala")

  }
}

执行结果如图

(you,2)
(flink,1)
(ok,1)
(world,1)
(hello,3)
(are,2)
(,3)
(how,1)
(spark,1)

H.King

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
flink wordcount demo

demopackage com.hbn.wcimport org.apache.flink.api.scala.{DataSet, ExecutionEnvironment}import org.apache.flink.api.scala._object WordCount { def main(args: Array[String]): Unit = { //获取执行环境 val env = ExecutionEnvironment.getExecutionE.
复制链接

扫一扫

专栏目录