Yarn上使用fink Application模式

Session模式集群:一个集群运行多个作业

per-job模式集群:一个集群运行一个作业。作业执行完毕集群销毁

Application 模式下,使用以下语句提交一个应用:

./bin/flink run-application -t yarn-application ./MyApplication.jar

使用此命令,所有配置参数都可以通过其配置选项(以-D为前缀)来指定

例如,用于指定JobManager和TaskManager的内存大小的命令如下所示:

 -Djava.security.krb5.conf=%s %s

为了进一步节省将Flink发行版传送到集群的带宽,请考虑将Flink发行版预上传到YARN可以访问的位置,并使用yarn.provided.lib.dirs配置选项, 最后,为了进一步节省提交应用程序jar所需的带宽,您可以将其预上传到HDFS,并指定指向./MyApplication.jar的远程路径如下所示

 -Dyarn.provided.lib.dirs=\"hdfs:///flink/jars/1.14.5/lib;
  hdfs:///flink/jars/1.14.5/plugin\
 -Dyarn.application.name=\"helloword_youye\

yarn

/opt/flink/bin/flink run-application -t yarn-application -Dyarn.application.name=myname -Dsecurity.kerberos.krb5-conf.path=/home/conf/current/security/krb5.conf --class com.dtdream.dataclean.RealtimeMain hdfs:///dtdream_140/resources/6474dbf5fcfa4157.20230817152706066 --configPath ./ --parallelism 1 --checkpointFailureNumber 20 --enableCheckpoint true

/opt/flink/bin/flink run-application: 运行 Flink 应用程序的脚本命令。

-t yarn-application: 指定应用程序类型为 YARN 应用程序,表示这个应用程序将在 YARN 集群上运行。

-Dyarn.application.name=youye: 设置 YARN 应用程序的名称为 "myname"。

-Dsecurity.kerberos.krb5-conf.path=/home/conf/current/security/krb5.conf: 这是设置 Kerberos 安全认证相关的配置,指定了 krb5.conf 文件的路径。

--calss com.dtdream.emr.flink.sql.SqlInApplicationModeMain  指定主类

hdfs:///dtdream_140/resources/6474dbf5fcfa4157.20230817152706066: 这是要处理的输入数据的路径,它位于 HDFS 中。

--configPath ./: 指定配置文件的路径为当前目录下。

--parallelism 1: 设置并行度为 1,即应用程序将以单一并行度运行。

--checkpointFailureNumber 20: 设置检查点失败次数为 20。

--enableCheckpoint true: 启用检查点功能,允许应用程序创建检查点以实现容错性。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值