Linux学习笔记——分布式内存计算Flink环境部署

5.13、分布式内存计算Flink环境部署

5.13.1、简介

Flink同Spark一样,是一款分布式内存计算引擎,可以支撑海量数据的分布式计算。

Flink在大数据体系同样是明星产品,作为最新一代的综合计算引擎,支持离线计算和实时计算。

在大数据领域广泛应用,是目前世界上除去Spark以外,应用最为广泛的分布式计算引擎。

我们将基于Hadoop集群,部署Flink Standalone集群。

Spark更加偏向于离线计算而Flink更加偏向于实时计算。

注意:

本小节的操作,基于:大数据集群(Hadoop生态)安装部署环节中所构建的Hadoop集群

如果没有Hadoop集群,请参阅大数据集群(Hadoop生态)安装部署,部署好环境。

5.13.2、安装

1、【node1操作】下载安装包

wget https://archive.apache.org/dist/flink/flink-1.10.0/flink-1.10.0-bin-scala_2.11.tgz

# 解压
tar -zxvf flink-1.10.0-bin-scala_2.11.tgz -C /export/server/

# 软链接
ln -s /export/server/flink-1.10.0 /export/server/flink

在这里插入图片描述

2、【node1操作】修改配置文件,conf/flink-conf.yaml

# 切换至/export/server/flink/conf
cd /export/server/flink/conf
# 编辑文件
vim flink-conf.yaml

flink-conf.yaml中清空内容(按键dG),并添加以下内容:

# jobManager 的IP地址
jobmanager.rpc.address: node1
# JobManager 的端口号
jobmanager.rpc.port: 6123
# JobManager JVM heap 内存大小
jobmanager.heap.size: 1024m
# TaskManager JVM heap 内存大小
taskmanager.heap.size: 1024m
# 每个 TaskManager 提供的任务 slots 数量大小
taskmanager.numberOfTaskSlots: 2
#是否进行预分配内存,默认不进行预分配,这样在我们不使用flink集群时候不会占用集群资源
taskmanager.memory.preallocate: false
# 程序默认并行计算的个数
parallelism.default: 1
#JobManager的Web界面的端口(默认:8081)
jobmanager.web.port: 8081

可能出现的问题:

  • 在可插入状态下,直接粘贴,会显示全部内容被注释掉。

解决方法:

  • 使用ESC退出可编辑状态,输入:set paste,然后按下i键,再次进行粘贴内容即可。

3、【node1操作】,修改配置文件,conf/slaves

# 切换至/export/server/flink/conf
cd /export/server/flink/conf
# 编辑文件
vim slaves

slaves中清空内容,并添加以下内容:

node1
node2
node3

4、【node1操作】分发Flink安装包到其它机器

cd /export/server
scp -r flink-1.10.0 node2:`pwd`/
scp -r flink-1.10.0 node3:`pwd`/

5、【node2、node3操作】

# 配置软链接
ln -s /export/server/flink-1.10.0 /export/server/flink

6、【node1操作】,启动Flink

/export/server/flink/bin/start-cluster.sh

在这里插入图片描述

7、验证Flink启动

# 浏览器打开
http://node1:8081

需要先停止Spark,不然进去看到的页面是Spark。

在这里插入图片描述

8、提交测试任务

【node1执行】

/export/server/flink/bin/flink run /export/server/flink-1.10.0/examples/batch/WordCount.jar

在这里插入图片描述

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Flink是一个开源的流处理和批处理框架,支持分布式部署。下面是Flink分布式部署的一般步骤: 1. 确保你有一个Flink集群:Flink需要在一个或多个计算机上运行,形成一个集群。你可以在每台计算机上安装Flink,也可以使用现有的集群管理器(如Apache Mesos、Hadoop YARN或Kubernetes)来管理Flink集群。 2. 配置Flink集群:在每台计算机上,你需要配置Flink集群的相关参数。主要的配置文件是`flink-conf.yaml`,其中包含了一些关键的配置项,如任务管理器的数量、内存分配等。你可以根据需要进行相应的配置。 3. 启动Flink集群:在每台计算机上启动Flink集群的组件,包括任务管理器(TaskManager)和作业管理器(JobManager)。作业管理器负责接收作业提交请求,并将作业分发给任务管理器执行。 4. 提交作业:使用Flink提供的客户端工具或API,将你的Flink作业提交到Flink集群中执行。你可以通过命令行工具`flink run`或使用Flink的REST API来提交作业。 5. 监控和管理:一旦作业提交成功,你可以使用Flink的Web界面或命令行工具来监控作业的执行情况。你可以查看作业的状态、任务的指标和日志等信息,也可以进行作业的管理操作,如取消、重新启动等。 以上是Flink分布式部署的一般步骤,具体的操作细节可能会有所不同,取决于你选择的集群管理器和部署环境。你可以参考Flink官方文档中的相关章节,了解更多详细信息。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值