Flink学习之环境搭建,项目结构

本文详细介绍了Apache Flink的环境搭建,包括Flink安装准备、代码编译与安装,以及Flink的运行,包括单机standalone模式和Yarn模式的运行,探讨了Flink的配置、日志查看和资源管理。此外,文章还提到了Flink 1.10版本的优化,如托管内存扩展、RocksDB配置简化、统一作业提交逻辑和Hive的生产就绪集成。
摘要由CSDN通过智能技术生成
1.Flink安装准备
  1. Flink 是一个以 Java 及 Scala 作为开发语言的开源大数据项目,代码开源在 GitHub 上,并使用 Maven 来编译和构建项目。对于大部分使用 Flink 的同学来说,Java、Maven 和 Git 这三个工具是必不可少的,另外一个强大的 IDE 有助于我们更快的阅读代码、开发新功能以及修复 Bug。因为篇幅所限,我们不会详述每个工具的安装细节,但会给出必要的安装建议。

  2. 关于开发测试环境,Mac OS、Linux 系统或者 Windows 都可以。如果使用的是 Windows 10 系统,建议使用 Windows 10 系统的 Linux 子系统来编译和运行。

  3. 工具 注释
    Java Java8以上
    Maven 必须使用Maven3以上版本
    Git Flink 的代码仓库是: https://github.com/apache/flink
2.Flink代码编译,安装
  1. 可以在Git上下载源码以后直接用IDE编译,编译生成的三个文件需要留意

    版本 注释
    flink-1.10.0.tar.gz Binary的压缩包
    flink-1.10.0-bin/flink-1.10.0 解压后的 Flink binary 目录
    flink-dist_2.11-1.10.0.jar 包含 Flink 核心功能的 jar 包
  2. 目前公司环境是从官网下载的binary包安装完成

3.Flink运行
1.单机standalone运行
1.基本启动流程

在这里插入图片描述
在这里插入图片描述

2.常用配置需求

conf / slaves

conf / slaves 用于配置 TaskManager 的部署,默认配置下只会启动一个 TaskManager 进程,如果想增加一个 TaskManager 进程的,只需要文件中追加一行“localhost”。

也可以直接通过“ ./bin/taskmanager.sh start ”这个命令来追加一个新的 TaskManager:

conf/flink-conf.yaml

conf/flink-conf.yaml 用于配置 JM 和 TM 的运行参数

3.日志查看需求

JobManager 和 TaskManager 的启动日志可以在 Flink binary 目录下的 Log 子目录中找到。Log 目录中以“flink-{id}-${hostname}”为前缀的文件对应的是 JobManager 的输出,其中有三个文件:

  • flink- u s e r − s t a n d a l o n e s e s s i o n − {user}-standalonesession- userstandalonesession{id}-${hostname}.log:代码中的日志输出
  • flink- u s e r − s t
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我从来不吃糖

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值