Flink集群(standalone)安装

节点规划

进程IP
JobManager10.192.192.8
TaskManager10.192.192.9
TaskManager10.192.192.10

安装配置

# 三台机器需提前安装jdk1.8
yum install -y java-1.8.0-openjdk-devel.x86_64

# 10.192.192.8执行
# 下载安装包
mkdir /opt/flink && cd /opt/flink

wget https://archive.apache.org/dist/flink/flink-1.14.4/flink-1.14.4-bin-scala_2.11.tgz

tar -zxvf flink-1.14.4-bin-scala_2.11.tgz
# 配置环境变量
vim /etc/profile
export FLINK_HOME=/opt/flink/flink-1.14.4
export PATH=$PATH:$FLINK_HOME/bin

# 重新加载
source /etc/profile
# 验证版本
flink --version

# 修改flink-conf.yaml配置
vim /opt/flink/flink-1.14.4/conf/flink-conf.yaml
taskmanager.numberOfTaskSlots: 5
jobmanager.rpc.address: 10.192.192.8

# 修改masters配置
vim /opt/flink/flink-1.14.4/conf/masters
10.192.192.8:8081

# 修改workers配置
vim /opt/flink/flink-1.14.4/conf/workers
10.192.192.9
10.192.192.10

# 复制配置文件
cd /opt
scp -r flink 10.192.192.9:/opt
scp -r flink 10.192.192.10:/opt

部署测试

# 10.192.192.8执行
# 启动集群(根据提示输入服务器登陆密码)
start-cluster.sh
# 验证进程
jps
[root@iZ2ze3n2wuzr90bp6211riZ conf]# jps
6308 StandaloneSessionClusterEntrypoint
6684 Jps

# 10.192.192.9执行
jps
[root@iZ2ze3n2wuzr90bp6211rkZ ~]# jps
3537 TaskManagerRunner
3823 Jps

# 10.192.192.10执行
[root@iZ2ze3n2wuzr90bp6211rjZ ~]# jps
3797 Jps
3735 TaskManagerRunner

加入系统服务

cat >/usr/lib/systemd/system/flink.service <<EOF
[Unit]
Description=Apache Flink:Stateful Computations over Data Streams
Documentation=https://flink.apache.org
After=network-online.target firewalld.service
Wants=network-online.target

[Service]
ExecStart=/opt/flink/flink-1.14.4/bin/start-cluster.sh
ExecStop=/opt/flink/flink-1.14.4/bin/stop-cluster.sh
ExecReload=/bin/kill -s HUP $MAINPID
LimitNOFILE=infinity
LimitNPROC=infinity
TimeoutStartSec=0
Delegate=yes
KillMode=process
Restart=on-failure
StartLimitBurst=3
StartLimitInterval=60s

[Install]
WantedBy=multi-user.target
EOF
systemctl enable flink.service && \
systemctl daemon-reload && \
systemctl start flink.service  && \
systemctl status flink.service 

备注

如果启动集群时,ssh端口不是默认的22端口,需要将其修改为指定端口:

vim /opt/flink/flink-1.14.4/conf/flink-conf.yaml
# 编辑如下,修改对应配置
env.ssh.opts: -p 指定端口

服务器之间免密登录(如果不知道登录密码):

# 生成公钥
ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa  && cat ~/.ssh/id_dsa.pub
# copy公钥至指定服务器
echo '公钥' >> ~/.ssh/authorized_keys
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Flink standalone集群搭建步骤如下: 1. 下载Flink安装包并解压缩到指定目录。 2. 配置Flink集群的masters和workers节点,可以在conf目录下的masters和workers文件中进行配置。 3. 启动Flink集群的masters节点,可以使用bin/start-cluster.sh命令启动。 4. 启动Flink集群的workers节点,可以使用bin/taskmanager.sh start命令启动。 5. 验证Flink集群是否正常运行,可以使用bin/flink list命令查看当前运行的Flink作业。 6. 在Flink集群中提交作业,可以使用bin/flink run命令提交作业。 7. 监控Flink集群的运行状态,可以使用Flink的Web UI或者JMX监控工具进行监控。 以上就是Flink standalone集群搭建的基本步骤,希望对您有所帮助。 ### 回答2: Apache Flink是一个处理流和批量数据的通用分布式计算引擎,可在大规模数据集上快速实现低延迟和高吞吐量。Flink提供了一个Standalone集群模式,使开发人员可以在自己的本地机器上测试和验证他们的应用程序,而无需构建一个完整的分布式环境。在本文中,我们将介绍如何搭建一个Flink Standalone集群。 1. 确保你的环境满足Flink的要求,比如安装Java环境等。 2. 下载Flink二进制文件。从Flink官网下载最新的tar文件,然后解压到一个目录下。 3. 配置Flink。打开conf/flink-conf.yaml文件,配置Flink的参数,比如jobmanager.rpc.address(JobManager监听的主机地址),taskmanager.numberOfTaskSlots(每个TaskManager能够执行的任务数)等。 4. 启动JobManager。在Flink的bin目录下执行以下命令: ./start-cluster.sh 这将启动JobManager和TaskManager进程。 5. 访问Flink Web Dashboard。在浏览器中输入http://localhost:8081,可以访问Flink Web Dashboard。这里可以查看集群的状态、运行中的任务、日志等。 6. 启动应用程序。使用Flink提供的运行脚本(bin/flink run)来提交应用程序。 7. 观察应用程序的运行状态。可以在Flink Web Dashboard中查看应用程序的运行状态和日志,还可以监控各种指标,如吞吐量、延迟、资源使用情况等。 8. 停止集群。在bin目录下执行以下命令: ./stop-cluster.sh 这将停止JobManager和TaskManager进程。 总之,通过Flink Standalone集群,您可以在本地机器上测试和验证您的应用程序,并且几乎没有任何成本。值得注意的是,Standalone集群并不适合生产环境,但当您需要在本地机器上调试应用程序时,它是一个很好的选择。 ### 回答3: Apache Flink是一个开源的分布式流处理系统。它以高效、可伸缩和容错为设计目标,因此广泛应用于大数据领域。Flink可以运行在各种集群上,包括Hadoop YARN和Apache Mesos等。在本文中,我们将讨论如何在Flink standalone集群上搭建分布式流处理系统。 Flink standalone集群搭建的准备工作: 在搭建Flink standalone集群之前,需要确保已经完成以下准备工作: 1. 安装Java 8或更高版本。 2. 下载Flink发行版,并解压缩至安装目录。 Flink standalone集群搭建的步骤: 1. 在主节点上启动Flink集群管理器。在Flink所在目录下,输入以下命令: ./bin/start-cluster.sh 2. 查看集群状态。在Flink所在目录下,输入以下命令: ./bin/flink list 如果输出结果为空,则说明集群状态正常。 3. 在从节点上启动TaskManager。在从节点所在机器上,输入以下命令: ./bin/taskmanager.sh start 4. 查看TaskManager状态。在从节点所在机器上,输入以下命令: ./bin/taskmanager.sh status 如果输出结果为“正常运行”,则说明TaskManager已经成功启动。 5. 提交Flink作业。在Flink所在目录下,输入以下命令: ./bin/flink run ./examples/streaming/SocketWindowWordCount.jar --port 9000 其中,SocketWindowWordCount.jar是一个简单的Flink作业,用于计算流式数据的词频统计。 6. 监控作业运行情况。在浏览器中输入以下地址: http://localhost:8081 可以查看作业的运行状态、性能指标等信息。 总结: 通过以上步骤,我们已经成功搭建了Flink standalone集群,并提交了一个简单的流处理作业。需要注意的是,本文仅提供了基础的搭建步骤,实际生产环境中还需要进行更加细致的配置和管理。同时,Flink具有丰富的API和生态系统,可以灵活应对不同的数据处理场景。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值