Flink三种提交方式

本文介绍了Flink在YARN环境下的三种提交任务方式:YARN session,YARN PerJob以及YARN Application模式。Application模式支持在YARN和K8s上部署,并可以通过-D参数自定义配置。文中还提供了应用模式下提交和杀死YARN作业的命令示例。
摘要由CSDN通过智能技术生成

第一种方式:YARN session

操作步骤

说明

1

yarn-session.sh(开辟资源)+flink run(提交任务)

这种模式下会启动yarn session,并且会启动Flink的两个必要服务:JobManager和Task-managers,然后你可以向集群提交作业。同一个Session中可以提交多个Flink作业。需要注意的是,这种模式下Hadoop的版本至少是2.2,而且必须安装了HDFS(因为启动YARN session的时候会向HDFS上提交相关的jar文件和配置文件)

通过./bin/yarn-session.sh脚本启动YARN Session

脚本可以携带的参数:

-n(--container):TaskManager的数量。(1.10 已经废弃)

-s(--slots): 每个TaskManager的slot数量,默认一个slot一个core,默认每个taskmanager的slot的个数为1,有时可以多一些taskmanager,做冗余。

-jm:JobManager的内存(单位MB)。

-q显示可用的YARN资源(内存,内核);

-tm:每个TaskManager容器的内存(默认值:MB)

-nm:yarn 的appName(现在yarn的ui上的名字)。  

-d:后台执行。

注意:

如果不想让Flink YARN客户端始终运行,那么也可以启动分离的 YARN会话。该参数被称为-d--detached

确定TaskManager数

Flink on YARN时,TaskManager的数量就是:max(parallelism) / yarnslots(向上取整)。例如,一个最大并行度为10,每个TaskManager有两个任务槽的作业,就会启动5个TaskManager。

2

去yarn页面:ip:8088可以查看当前提交的flink session

3

停止当前任务:

yarn application -kill  application_1527077715040_0007

第二种方式:YARN PerJob

  1. 使用flink直接提交任务

bin/flink run

### 回答1: 在 Apache Flink 中,有两种提交模式: 1. 本地模式:在本地运行 Flink 程序,通常用于开发和测试。 2. 集群模式:将 Flink 程序提交到远程 Flink 集群中运行。 在集群模式下,还有两种提交方式: - 交互式提交:通过 Flink 自带的 web 界面,手动提交 Flink 程序。 - 非交互式提交:通过命令行工具或者脚本自动提交 Flink 程序,通常用于生产环境。 ### 回答2: flink提交有两种模式:本地模式和集群模式。 1. 本地模式:在本地模式下,Flink应用程序可以直接在开发者的本地机器上运行。在本地模式下,应用程序不需要连接到Flink集群,并且所有的任务都在本地地机器上执行。这种模式适用于开发和测试Flink应用程序,它可以提供快速的开发和调试过程。 2. 集群模式:在集群模式下,Flink应用程序需要连接到一个Flink集群,这个集群由一组相互连接的Flink任务管理器(TaskManager)组成。在集群模式下,应用程序将提交Flink集群,由集群来分配和管理任务的执行。这种模式适用于生产环境中的实际应用程序部署,可以实现高可用性和高并发的计算。 无论是本地模式还是集群模式,都需要使用Flink自带的命令行工具或者使用Fink的API来提交应用程序。在本地模式下,可以直接使用命令`./bin/flink run`来提交应用程序。在集群模式下,首先需要在集群上启动Flink,然后使用命令`./bin/flink run -m <jobmanager-address> <path-to-jar-file>`来提交应用程序。 ### 回答3: flink提交有两种模式。 第一种是本地模式,也称为“单机模式”或“本地集群模式”。在这种模式下,flink作业是在本地计算机上运行的,不涉及到远程连接。这种模式适用于小规模的数据处理和开发测试,通过本地计算资源即可完成计算。在本地模式下,flink启动一个MiniCluster来模拟分布式集群环境,能够同时运行多个任务。本地模式对于快速迭代和调试有很大的帮助。 第二种是集群模式,也称为“分布式模式”。在这种模式下,flink作业是通过将任务提交到远程flink集群上执行的。远程flink集群由多台计算机组成,可以有效地处理大规模的数据。集群模式可以通过命令行或Web UI进行任务提交flink会将作业分配给可用资源,然后进行计算。集群模式可以根据实际需求进行扩展,提高计算的并行度和整体处理能力。 总结来说,flink提交有两种模式:本地模式和集群模式。本地模式适用于小规模的数据处理和开发测试,而集群模式适用于大规模数据的分布式计算。不论采用哪种模式,flink都能够提供高效、可靠的数据处理和分析能力。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值