Flink部署安装及其WorldCount执行

   Flink启动及其WorldCount执行

大家好,是瓜哥,最近几年,大数据处理组件Flink非常火,作为一个从事多年java的老程序员,也得跟上时代的技步伐,不然迟早就会被这个技术千变万化的时代抛弃。

Flink 是一个针对流数据和批数据的分布式处理引擎,代码主要是由 Java 实现,部分代码是 Scala。它可以处理有界的批量数据集、也可以处理无界的实时数据集。对 Flink 而言,其所要处理的主要场景就是流数据,批数据只是流数据的一个极限特例而已,所以 Flink 也是一款真正的流批统一的计算引擎。

要想获取最新的学习资料,就需要到官网里面进行学习。这里面汇集了Flink各个迭代版本。今天咋们按照官网的文档资料来进行Flink项目的部署和第一个Helloword程序运行。

首先登陆官网:Apache Flink: Stateful Computations over Data Streams

当前最新flink版本为Flink 1.14,点击进入如下目录:

 

然后进入如下文档页面:

 

步骤 1:下载 

为了运行Flink,只需提前安装好 Java 8 或者 Java 11。你可以通过以下命令来检查 Java 是否已经安装正确。

java -version

下载Flink相关安装包:Apache Downloads

进入linux安装目录:

执行wget命令下载安装包,如下图:

 

$ tar -xzf flink-1.14.0-bin-scala_2.12.tgz

$ cd flink-1.14.0-bin-scala_2.12.tgz

步骤 2:启动集群 

Flink 附带了一个 bash 脚本,可以用于启动本地集群。

$ ./bin/start-cluster.sh

Starting cluster.

Starting standalonesession daemon on host.

Starting taskexecutor daemon on host.

启动截图如下:

 

步骤 3: 访问WebUI

本人用的国产的深度系统Deppin,通过命令ifconfig查看IP地址如下:

 

Flink启动成以后在浏览器中登录如下地址:http://192.168.0.128:8081/#/overview

 

步骤 4:提交作业(Job) 

Flink Releases 附带了许多的示例作业。你可以任意选择一个,快速部署到已运行的集群上。

 

$ ./bin/flink run examples/streaming/WordCount.jar

$ tail log/flink-*-taskexecutor-*.out

另外,你可以通过 Flink  Web UI 来监视集群的状态和正在运行的作业。

执行结果如下:

 

步骤 5:停止集群 #

完成后,你可以快速停止集群和所有正在运行的组件。

$ ./bin/stop-cluster.sh

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

IT瓜哥-杨得朝

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值