flink入门_分布式计算框架之Flink入门

坚持原创,共同进步!请关注我,后续分享更精彩!!!

Flink是什么

Apache Flink 是一个在无界和有界数据流上进行状态计算的框架和分布式处理引擎。Flink 已支持在所有常见的集群环境(k8s、yarn)中运行,并以 in-memory 的速度和任意的规模进行计算。

简言之,Flink是基于数据流之上的一个有状态的开源计算框架。

490caf15e69a9332db1c7f008a9fdbed.png

上图为Flink的工作示意图,中间蓝框部分是Flink的处理单元。上游可对接实时(实时事件流)和离线(db/文件/kv存储格式)形式的数据流,经过Flink框架的转换处理,再流向下游的应用系统、新的实时事件流或数据存储(db/文件/kv存储格式)。

Flink特性

  • 流和批计算支持,适合事件驱动类型应用、流和批数据分析、ETL处理等场景。
  • 正确性保证,支持Exactly-once(精确一次)语义、Event-time processing(实践时间处理)、Sophisticated late data handling(复杂延迟数据处理)等功能机制。
  • 易用的分层api,SQL on Stream & Batch Data、DataStream API & DataSet API、ProcessFunction (Time & State)等。
  • 低延迟、高吞吐率、内存计算模型。
  • 高可用安装,灵活的部署方式,Savepoints支持。
  • 可伸缩架构,大容量应用数据状态存储,增量checkpointing(检查点)机制支持。

Flink架构

18c18fc3ffc35b9734f3e289158b1267.png

Flink框架架构分为JobManager和TaskManager两部分,其中JobManager复杂协调管理,TaskManager复杂具体任务逻辑处理。Flink Program程序只作为clinet的连接交互,无实际应用实例运行。

Flink docker安装

Flink部署安装方式有很多种,本文只作入门介绍,这里以docker单机方式安装,便于快速学习了解Flink框架。

Flink其他安装部署可参考https://ci.apache.org/projects/flink/flink-docs-release-1.11/中的Deployment & Operations部分。

158a85f453e0c366fcac1b5f3974f749.png

docker image版本

Flink框架支持java和scala语言,在镜像版本中也有相应体现。如flink:1.11.2-scala_2.11,表示flink版本1.11.2,scala版本2.11。官方也同时提供了简写的版本方式。

  • flink:latest → flink:-scala_
  • flink:1.11 → flink:1.11.-scala_2.11

详细tag版本可参考地址:

https://hub.docker.com/_/flink/?tab=tags

docker安装

创建docker网络:

docker network create flink-network
fd77471f57e6dfb0928321820c751f43.png

如上图,执行创建命令后,docker network ls查看,出现flink-network表明创建成功。

创建Flink JobManager:

docker run -d     --rm     --name=jobmanager     --network flink-network     -p 8081:8081     --env FLINK_PROPERTIES="jobmanager.rpc.address: jobmanager"     flink:1.11.2-scala_2.11 jobmanager

创建Flink TaskManager:

docker run -d     --rm     --name=taskmanager     --network flink-network     --env FLINK_PROPERTIES="jobmanager.rpc.address: jobmanager"     flink:1.11.2-scala_2.11 taskmanager

查看docker容器:

执行docker ps,查看jobmanager和taskmanager。

bf3bfcd8ffbbdc093f69da19abe6f025.png

管理界面:

浏览器访问jobmanager界面http://192.168.31.113:8081/,192.168.31.113请自行替换为docker安装ip。

3bb2eba65818e5f45e3bab83f1916fd2.png

点击界面菜单submit new job --> add new 按钮,即可将flink程序上传到Flink执行环境中执行。

总结

本文对Flink计算框架进行了简单介绍。阐述了Flink框架的作用,支持特性,架构设计,以及docker安装。通过以上内容的学习,相信对Flink框架概况有了整体的认识和初步的了解。

希望本文对初学者有所帮助和参考。后续会陆续更新更多技术内容,有兴趣同学请关注我,欢迎一起学习和探讨。谢谢!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值