Flink集群搭建

Flink集群搭建

Local本地运行方式

在IDEA运行即可,主要用于开发

StandAlone模式

Flink自带的资源管理框架,不需要依赖于任何其他的框架

1、上传解压
tar -zxvf flink-1.11.2-bin-scala_2.11.tgz -C /usr/local/soft/
2、修改环境变量
vim /etc/profile
# 将flink的bin目录配置到环境变量PATH中
3、修改配置文件
cd /usr/local/soft/flink-1.11.2/conf

vim flink-conf.yaml
# 将localhost改成master
jobmanager.rpc.address: master

# 配置从节点
vim workers
node1
node2

# 修改master地址
vim masters
master:8081
4、同步到node1、node2
cd /usr/local/soft/

scp -r flink-1.11.2/ node1:`pwd`
scp -r flink-1.11.2/ node2:`pwd`
5、启动集群
# 只要在master运行
start-cluster.sh
6、访问Flink的WEB UI
http://master:8081
7、提交任务
  • 通过flink命令提交任务

    flink run -c com.shujia.core.Demo01WordCount Flink-1.0.jar
    
  • 通过WEB界面提交任务

  • 通过RPC远程调用方式提交任务

8、停止集群
stop-cluster.sh
On Yarn模式

主流的运行方式,主要用于生产环境

yarn-session先在yarn中启动一个jobMansager ,所有的任务共享一个jobmanager (提交任务更快,任务之间共享jobmanager , 相互有影响)

直接提交任务模型,为每一个任务启动一个joibmanager (每一个任务独立jobmanager , 任务运行稳定)

准备工作
  • 配置环境变量,增加HADOOP_CONF_DIR

    vim /etc/profile
    
    export HADOOP_CONF_DIR=/usr/local/soft/hadoop-2.7.6/etc/hadoop/
    
  • 添加HADOOP依赖

    cp flink-shaded-hadoop-2-uber-2.7.5-10.0.jar /usr/local/soft/flink-1.11.2/lib/
    
  • 启动Hadoop集群

    # 在master执行
    start-all.sh
    
Yarn-Session模式

相当于在Yarn中启动了一个JobManager,当有任务提交时会根据任务的并行度去申请资源启动所需的TaskManager

  • 启动:yarn-session.sh -jm 1024m -tm 1024m
  • 访问:启动后日志里有地址或者通过Yarn WEB UI进行跳转
  • 提交任务:
    • 命令:flink run -c com.shujia.core.Demo01WordCount Flink-1.0.jar
    • 通过页面提交
    • 通过RPC方式提交
直接On Yarn

相当于每次提交任务都会单独生成一个JobManager

  • 只需要启动Yarn即可

  • 只能使用命令方式提交Flink任务

    flink run -m yarn-cluster  -yjm 1024m -ytm 1024m -c com.shujia.core.Demo01WordCount Flink-1.0.jar
    
  • 停止任务

    • 在JobManager界面通过Cancel按钮取消

    • 通过Yarn的命令kill

      yarn application -kill application_1654850164441_0002
      
  • 查看日志

    yarn logs -applicationId application_1654850164441_0002
    
要在三台 Linux 服务器上搭建 Flink 集群,可以按照以下步骤进行: 1. 准备环境:需要三台 Linux 服务器,每台服务器最好配置相同的硬件和软件环境。安装 Java 运行环境,并确保三台服务器之间可以互相通信。 2. 下载和解压 Flink:从 Flink 官网下载最新的 Flink 版本,并解压到一个目录,例如 /opt/flink。 3. 配置 Flink:修改 Flink 的配置文件 flink-conf.yaml,根据实际情况配置参数,包括 JobManager 和 TaskManager 的内存大小、并行度、网络端口等。需要修改以下参数: ```yaml jobmanager.rpc.address: <JobManager 的 IP 地址> taskmanager.numberOfTaskSlots: <每个 TaskManager 的任务槽数量> ``` 4. 启动 JobManager:在其中一台服务器上启动 JobManager。进入 Flink 的 bin 目录,执行命令 `./start-cluster.sh`,启动 JobManager。 5. 启动 TaskManager:在另外两台服务器上分别启动 TaskManager。进入 Flink 的 bin 目录,执行命令 `./taskmanager.sh start`,启动 TaskManager。 6. 提交任务:使用 Flink 提供的命令行工具 flink run 提交任务,例如 `flink run -c com.example.MyJob /path/to/my-job.jar`。 7. 监控和管理:可以使用 Flink 的 Web 接口或者命令行工具 flink list、flink cancel 等进行任务的监控和管理。 以上是一个简单的 Flink 集群搭建的步骤。在实际部署中需要考虑更多的因素,例如高可用性、容错性、安全性等。建议参考 Flink 官方文档进行更详细的配置和部署。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

没钳蟹蟹

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值