Flink概念图

最新推荐文章于 2024-04-29 23:26:33 发布

爱学习的菜鸟罢了

最新推荐文章于 2024-04-29 23:26:33 发布

阅读量455

点赞数 1

分类专栏： flink 大数据文章标签： flink

本文链接：https://blog.csdn.net/qq_34387470/article/details/115353314

版权

本文详述了Flink从v1.7到v1.11的版本变化，涵盖State、配置、Table API、连接器等多个方面，并着重介绍了Flink对Hive支持的逐步增强，包括HiveCatalog、SQL DDL支持和向量化读取等特性。

摘要由CSDN通过智能技术生成

因为网上大部分图都很渣所以自己整理了几张原创图,划清清浊

支持scala2.12版本
状态中序列化类演变
- TypeSerializerSnapshot替换TypeSerializerConfigSnapshot
删除legacy mode
Savepoints可用于恢复
- 之前，当使用一次精确的接收器时，如果在执行保存点之后，在下一个savepoint出现之前发生故障，则可能会遇到重复输出数据的问题。
MetricQueryService在单独的线程池中运行
延迟指标的粒度
延迟标记激活
迁移Hadoop的依赖项
支持多槽TaskManager
StandaloneJobClusterEntrypoint生成具有固定JobID的JobGraph
Scaca shell不支持scala2.12
故障转移策略的限制
Window之前SQL子句可选
OperatorSnapshotUtil写入v2快照
SBT Project 和 MiniClusterResource
- 如果使用sbt构建的项目需要使用MiniClusterResource，需要配置flink-runtime依赖jar

Flink中不再自动绑定Hadoop依赖
- Flink不再绑定Hadoop库，如需依赖，手动下载hadoop jar，并将其复制$FLINK_HOME/lib目录中

TaskManager配置
- TaskManagers默认绑定到主机IP地址而不是主机名
- 可以再flink-conf.yaml文件中，通过配置选项控制：taskmanager.network.bind-policy

弃用直接使用Table构造函数用法
- 使用 table.joinLateral()或 table.leftOuterJoinLateral()代替
引入新的CSV格式描述符
在TableEnvironment上弃用静态生成器方法
- TableEnvironment.getTableEnvironment()不建议使用静态方法，使用Batch/StreamTableEnvironment.create()
更改Table API的maven模块
- java语言使用flink-table-api-java-bridge，scala语言使用flink-table-api-scala-bridge
更改外部目录表构建器
- 不推荐使用ExternalCatalogTable.builder()，推荐使用ExternalCatalogTableBuilder()
更改Table API连接器jar的命名
- 使用maven构建jar依赖时，不再具有sql-jar限定符，并且artifactId现在以flink-sql代替flink，例如 flink-sql-connector-kafka
更改制定Null字面含义
- 需要使用Table API定义Null字面含义，nullOf(type)，而不是Null(type)

在Fink 1.8.0和更低版本中，taskmanager的托管内存部分由进行控制taskmanager.memory.fraction，并且默认值为0.7。但是，有时由于JVM参数NewRatio的默认值为2，这将导致OOMs ，这意味着旧版本仅占用堆内存的2/3（0.66）。因此，如果遇到这种情况，请手动将此值更改为较低的值。