实时数仓、基于Flink1.11的SQL构建实时数仓之搭建flink集群

最新推荐文章于 2024-08-04 17:39:09 发布

源远流云

最新推荐文章于 2024-08-04 17:39:09 发布

阅读量666

点赞数

分类专栏：技术篇文章标签： hadoop flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ddyun/article/details/111246432

版权

技术篇专栏收录该内容

11 篇文章 0 订阅

订阅专栏

实时数仓、基于Flink1.11的SQL构建实时数仓之搭建flink集群

目录

实时数仓、基于Flink1.11的SQL构建实时数仓之搭建flink集群

一. 环境准备

二. 安装配置

三. 启动集群

一. 环境准备

jdk1.8

hadoop环境

zookeeper环境

集群规划

192.168.137.123 s1
192.168.137.124 s2
192.168.137.125 s3

详见：实时数仓、基于Flink1.11的SQL构建实时数仓环境说明

二. 安装配置

1.下载安装包

官网地址：https://flink.apache.org/zh/downloads.html

下载版本：flink-1.11.2-bin-scala_2.11.tgz

下载hdfs插件包 flink-shaded-hadoop-2-uber-2.8.3-9.0.jar

2.上传到服务s1 并配置

上传目录：/opt/hadoop

解压：tar -zxf flink-1.11.2-bin-scala_2.11.tgz

2.1 修改配置文件 flink-conf.yaml

配置文件目录：/opt/hadoop/flink-1.11.2/conf

参考官网修改关键参数

[root@s1 conf]# cat flink-conf.yaml

jobmanager.rpc.address: s1

# The RPC port where the JobManager is reachable.

jobmanager.rpc.port: 6123

taskmanager.memory.process.size: 1728m

#Slots 集群单节点的并行度，默认是1 根据自己机器的情况调整。

taskmanager.numberOfTaskSlots: 20
high-availability: zookeeper
high-availability.storageDir: hdfs:///flink/ha/
high-availability.zookeeper.quorum: s1:2181,s2:2181,s3:2181
state.checkpoints.dir: hdfs:///flink/flink-checkpoints

state.savepoints.dir: hdfs:///flink/flink-savepoints

jobmanager.execution.failover-strategy: region

yarn.application-attempts: 10
high-availability.zookeeper.path.root: /flink
high-availability.cluster-id: /default_ns
#错误重试防止flink任务因为源数据有误造成任务出错后就退出了
restart-strategy: fixed-delay
restart-strategy.fixed-delay.attempts: 3
restart-strategy.fixed-delay.delay: 10 s

2.2 修改配置文件masters

配置master节点

[root@s1 conf]# cat masters
s1:8081
s2:8081

2.3 修改配置文件workers

配置TaskManager节点

[root@s1 conf]# cat workers
s1
s2
s3

2.4 配置flink环境变量

在 /etc/profile中添加如下：
export FLINK_HOME=/opt/hadoop/flink-1.11.2
export PATH=$PATH:$FLINK_HOME/bin

3.拷贝 flink-shaded-hadoop-2-uber-2.8.3-9.0.jar

将jar包 flink-shaded-hadoop-2-uber-2.8.3-9.0.jar 拷贝到flink 的lib目录下

4. 分发到 s2 s3 两个节点

scp -r /opt/hadoop/flink-1.11.2 root@s2:/opt/hadoop/

scp -r /opt/hadoop/flink-1.11.2 root@s3:/opt/hadoop/

三. 启动集群

在s1 或 s2 执行：start-cluster.sh

停止集群：stop-cluster.sh

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。