Flink 1.15.1 集群搭建(StandaloneSession)

一 、准备

1、Flink版本

 Apache Flink 1.15.1 for Scala 2.12

2、系统平台

linux debian11.4_64。

3、节点

  • 192.168.1.25(flink-master、flink-worker-1)
  • 192.168.1.26(flink-worker-2)
  • 192.168.1.27(flink-worker-3)

4、配置

(1) 本地DNS设置

分别在三个节点的/etc/hosts文件中添加如下内容:

192.168.1.25 flink-master
192.168.1.25 flink-worker-1
192.168.1.26 flink-worker-2
192.168.1.27 flink-worker-3

(2) ssh免密登录设置

Flink独立集群通过运行 sshd 以执行用于管理 Flink 各组件的脚本。

1)生成秘钥

分别在三个节点上执行如下命令:

ssh-keygen

2)安装公钥

把当前节点的公钥安装到其他节点上(包含当前节点),即将本节点的~/.ssh /id_rsa.pub文件内容添加到其他集群节点的~/.ssh/authorized_keys文件中,则其他集群节点就可以免密登录本节点。

分别在三个节点上执行如下三条命令:

ssh-copy-id flink-worker-1
ssh-copy-id flink-worker-2
ssh-copy-id flink-worker-3

二、搭建集群

1、安装路径

将下载的Flink二进制包解压,复制到/opt/flink-1.15.1路径下。三个节点相同。

2、配置集群节点列表

在master节点上配置即可。

1)主节点(jobmanager)

修改/opt/flink-1.15.1/conf/masters文件,添加master节点地址,内容如下:

flink-master:8081

2)工作节点(taskmanager)

修改/opt/flink-1.15.1/conf/workers文件,添加worker节点地址,内容如下:

flink-worker-1
flink-worker-2
flink-worker-3

通过配置masters、workers,就可以通过start-cluster.sh和stop-cluster.sh脚本来统一管理(启动、关闭等)所有集群的节点,方便、快捷。

我们也可以不配置masters、workers,不通过start-cluster.sh和stop-cluster.sh脚本来管理集,直接通过执行 “ jobmanager.sh start | stop ”、“ taskmanager.sh start | stop ” 来启动主节点和工作节点(通过start-cluster.sh启动的集群,也可以通过taskmanager.sh动态添加或移除工作节点)。

3、集群参数配置

分别修改三个节点的/opt/flink-1.15.1/conf/flink-conf.yaml文件,关键内容如下(其他参数视情况设定):

# master地址
jobmanager.rpc.address: flink-master
 
# master端口
jobmanager.rpc.port: 6123

# master地址绑定设置(master节点参数)
jobmanager.bind-host: 0.0.0.0

# worker地址绑定设置
taskmanager.bind-host: 0.0.0.0

# worker地址(注意:三个worker节点的host不一样)
taskmanager.host: flink-worker-1
 
# worker槽位数设置
taskmanager.numberOfTaskSlots: 2
 
# 默认并行度
parallelism.default: 2

# WEB UI 端口(master节点参数)
rest.port: 8081

# WEB UI 管理地址
rest.address: flink-master

# WEB UI 地址绑定设置,想让外部访问,可以设置具体的IP,或者直接设置成“0.0.0.0”(master节点参数)
rest.bind-address: 0.0.0.0

# Job文件目录(master节点参数)
web.upload.dir: /opt/flink-1.15.1/usrlib

# IO临时目录,默认:/tmp
io.tmp.dirs: /opt/flink-1.15.1/tmp

# 集群节点进程ID存放目录,默认:/tmp
env.pid.dir: /opt/flink-1.15.1/pids

注意:

三个worker节点的"taskmanager.host"参数是不一样的,改成各自的地址即可。每个worker节点的槽位数和并行度也可以根据节点自身的条件进行设置。

4、启动集群

在master节点上,通过/opt/flink-1.15.1/bin/start-cluster.sh脚本即可启动集群(standalonesession模式)。运行该脚本,会自动启动jobmanager节点和集群中的其他三个taskmanager(无需在其他节点上启动taskmanager)。

启动过程:

管理界面(概览):

管理界面(jobmanager):

 管理界面(taskmanager):

 5、关闭集群

在master节点上,运行/opt/flink-1.15.1/bin/stop-cluster.sh脚本即可,会同时停止jobmanager和所有的taskmanager。

二、执行JOB

上传任务JAR:

任务状态:

 

### 回答1: Flink standalone集群搭建步骤如下: 1. 下载Flink安装包并解压缩到指定目录。 2. 配置Flink集群的masters和workers节点,可以在conf目录下的masters和workers文件中进行配置。 3. 启动Flink集群的masters节点,可以使用bin/start-cluster.sh命令启动。 4. 启动Flink集群的workers节点,可以使用bin/taskmanager.sh start命令启动。 5. 验证Flink集群是否正常运行,可以使用bin/flink list命令查看当前运行的Flink作业。 6. 在Flink集群中提交作业,可以使用bin/flink run命令提交作业。 7. 监控Flink集群的运行状态,可以使用Flink的Web UI或者JMX监控工具进行监控。 以上就是Flink standalone集群搭建的基本步骤,希望对您有所帮助。 ### 回答2: Apache Flink是一个处理流和批量数据的通用分布式计算引擎,可在大规模数据集上快速实现低延迟和高吞吐量。Flink提供了一个Standalone集群模式,使开发人员可以在自己的本地机器上测试和验证他们的应用程序,而无需构建一个完整的分布式环境。在本文中,我们将介绍如何搭建一个Flink Standalone集群。 1. 确保你的环境满足Flink的要求,比如安装Java环境等。 2. 下载Flink二进制文件。从Flink官网下载最新的tar文件,然后解压到一个目录下。 3. 配置Flink。打开conf/flink-conf.yaml文件,配置Flink的参数,比如jobmanager.rpc.address(JobManager监听的主机地址),taskmanager.numberOfTaskSlots(每个TaskManager能够执行的任务数)等。 4. 启动JobManager。在Flink的bin目录下执行以下命令: ./start-cluster.sh 这将启动JobManagerTaskManager进程。 5. 访问Flink Web Dashboard。在浏览器中输入http://localhost:8081,可以访问Flink Web Dashboard。这里可以查看集群的状态、运行中的任务、日志等。 6. 启动应用程序。使用Flink提供的运行脚本(bin/flink run)来提交应用程序。 7. 观察应用程序的运行状态。可以在Flink Web Dashboard中查看应用程序的运行状态和日志,还可以监控各种指标,如吞吐量、延迟、资源使用情况等。 8. 停止集群。在bin目录下执行以下命令: ./stop-cluster.sh 这将停止JobManagerTaskManager进程。 总之,通过Flink Standalone集群,您可以在本地机器上测试和验证您的应用程序,并且几乎没有任何成本。值得注意的是,Standalone集群并不适合生产环境,但当您需要在本地机器上调试应用程序时,它是一个很好的选择。 ### 回答3: Apache Flink是一个开源的分布式流处理系统。它以高效、可伸缩和容错为设计目标,因此广泛应用于大数据领域。Flink可以运行在各种集群上,包括Hadoop YARN和Apache Mesos等。在本文中,我们将讨论如何在Flink standalone集群上搭建分布式流处理系统。 Flink standalone集群搭建的准备工作: 在搭建Flink standalone集群之前,需要确保已经完成以下准备工作: 1. 安装Java 8或更高版本。 2. 下载Flink发行版,并解压缩至安装目录。 Flink standalone集群搭建的步骤: 1. 在主节点上启动Flink集群管理器。在Flink所在目录下,输入以下命令: ./bin/start-cluster.sh 2. 查看集群状态。在Flink所在目录下,输入以下命令: ./bin/flink list 如果输出结果为空,则说明集群状态正常。 3. 在从节点上启动TaskManager。在从节点所在机器上,输入以下命令: ./bin/taskmanager.sh start 4. 查看TaskManager状态。在从节点所在机器上,输入以下命令: ./bin/taskmanager.sh status 如果输出结果为“正常运行”,则说明TaskManager已经成功启动。 5. 提交Flink作业。在Flink所在目录下,输入以下命令: ./bin/flink run ./examples/streaming/SocketWindowWordCount.jar --port 9000 其中,SocketWindowWordCount.jar是一个简单的Flink作业,用于计算流式数据的词频统计。 6. 监控作业运行情况。在浏览器中输入以下地址: http://localhost:8081 可以查看作业的运行状态、性能指标等信息。 总结: 通过以上步骤,我们已经成功搭建了Flink standalone集群,并提交了一个简单的流处理作业。需要注意的是,本文仅提供了基础的搭建步骤,实际生产环境中还需要进行更加细致的配置和管理。同时,Flink具有丰富的API和生态系统,可以灵活应对不同的数据处理场景。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值