Flink-从文件读取数据，输出到文件

IMezZ

已于 2022-10-27 17:10:27 修改

阅读量1.7k

点赞数 1

分类专栏： Flink 文章标签： flink 大数据

于 2022-10-27 17:07:52 首次发布

本文链接：https://blog.csdn.net/qq_36249352/article/details/127555877

版权

这篇博客介绍了如何在Flink中从资源文件读取数据，如'words'文件，然后处理这些数据，并将结果输出到新的文件'result.txt'。文件内容包括多行文本，每行包含不同的欢迎语。代码示例展示了处理过程。

摘要由CSDN通过智能技术生成

1、文件准备

在项目的resource目录下创建一个words文件

文件内容：

hello word
hello scala
hello flink
hello spark

2、数据处理

文件准备后，开始读取文件，将处理后数据输出到目标文件中

代码：

object Wordcount {

  def main(args: Array[String]): Unit = {

    //创建环境变量
    val env = StreamExecutionEnvironment.getExecutionEnvironment
    //设置并行为1
    env.setParallelism(1)
    //文件路径
    val filePath="D:\\BBQ\\bigdata-dm\\flinkemo\\src\\main\\scala\\resource\\words.txt"
    //读取文件
    val inputDS=env.readTextFile(filePath)
    //分词统计
    import org.apache.flink.api.scala._
    val wordcountDS =inputDS.flatMap(_.split(" ")).map((_, 1)).keyBy(0).sum(1)
    wordcountDS.print()
    wordcountDS.writeAsText("D:\\BBQ\\bigdata-dm\\