Flink初体验（一）

最新推荐文章于 2024-07-17 13:10:51 发布

zoocoffee

最新推荐文章于 2024-07-17 13:10:51 发布

阅读量297

点赞数 4

分类专栏： Flink 文章标签： Flink 项目搭建 Flink依赖

本文链接：https://blog.csdn.net/esundong/article/details/99627445

版权

本文介绍了Flink的基础知识，强调了其在数据流处理和批量数据处理中的重要性。通过一个简单的WordCount例子，展示了如何使用Idea构建Flink项目，并提供了添加依赖的步骤，引导读者初次接触和体验Flink。

摘要由CSDN通过智能技术生成

开发工具：Idea

语言：java

Flink版本：flink 1.8.1

JDK：1.8+

一、Flink简介

Flink 是一个同时面向数据流处理和批量数据处理的开源框架和分布式处理引擎，主要由Java和Scala语言编写，具有高吞吐、低延迟、高扩展、支持容错等特性。

其以数据并行和流水线方式执行任意流数据程序，流水线运行时系统可以执行批处理和流处理程序。此外，Flink 的运行时本身也支持迭代算法的执行。

众所周知，阿里非常重视Flink，阿里巴巴在 2015 年开始尝试使用 Flink，但因当时 Flink 面世不久稍显稚嫩，阿里巴巴在 Flink 的基础上维护了一个内部版本的实时计算平台 Blink，以满足自身超大体量的业务需求，今年 1 月 28 日阿里将Blink开源的事儿在大数据圈引起了不小的骚动。

由此可见Flink的重要性，在此篇文章，我将以一个WordCount的例子让大家对Flink有一个初步体验。

二、项目构建

方式一：

$ mvn archetype:generate                               \
      -DarchetypeGroupId=org.apache.flink              \
      -DarchetypeArtifactId=flink-quickstart-java      \
      -DarchetypeVersion=1.8.0

方式二：

$ curl https://flink.apache.org/q/quickstart.sh | bash -s 1.8.0

方式三：

1、使用Idea构建一个普通的Java项目，在pom.xml中加入依赖

2、Flink分为流式处理和批处理，所需要的基本依赖：

流式处理：

<dependency>
      <groupId>org.apache.flink</groupId>
      <artifactId>flink-streaming-java_${scala.binary.version}</artifactId>
      <version>${flink.version}</version>
      <scope>provided</scope>
</dependency>

批处理：

 <dependency>
      <groupId>org.apache.flink</groupId>
      <artifactId>flink-java</artifactId>
      <version>${flink.version}</version>
      <scope>provided</scope>
</dependency>

3、提供一个基础版 Flink项目pom.xml