第七篇：Flink 常见核心概念分析

最新推荐文章于 2023-09-22 21:56:40 发布

王知无(import_bigdata)

最新推荐文章于 2023-09-22 21:56:40 发布

阅读量386

点赞数

分类专栏： Flink高级进阶和企业级应用

原创文章禁止转载。否则追究法律后果。

本文链接：https://blog.csdn.net/u013411339/article/details/118946545

版权

Flink高级进阶和企业级应用专栏收录该内容

43 篇文章 130 订阅 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

这篇博客介绍了Flink的分布式缓存，包括其原理、应用场景及使用方法，并强调了缓存文件的注意事项。接着讨论了Flink的故障恢复策略，如基于Region的局部重启和不同类型的重启策略，以及如何配置这些策略。最后，文章提到了并行度的重要性及其设置方式，包括算子级别、执行环境级别、提交任务级别和系统配置级别的设定。

摘要由CSDN通过智能技术生成

你好，欢迎来到 07 课时，本课程主要讲解 Flink 中的一些核心概念。

在 Flink 这个框架中，有很多独有的概念，比如分布式缓存、重启策略、并行度等，这些概念是我们在进行任务开发和调优时必须了解的，这一课时我将会从原理和应用场景分别介绍这些概念。

分布式缓存

熟悉 Hadoop 的你应该知道，分布式缓存最初的思想诞生于 Hadoop 框架，Hadoop 会将一些数据或者文件缓存在 HDFS 上，在分布式环境中让所有的计算节点调用同一个配置文件。在 Flink 中，Flink 框架开发者们同样将这个特性进行了实现。

Flink 提供的分布式缓存类型 Hadoop，目的是为了在分布式环境中让每一个 TaskManager 节点保存一份相同的数据或者文件，当前计算节点的 task 就像读取本地文件一样拉取这些配置。

分布式缓存在我们实际生产环境中最广泛的一个应用，就是在进行表与表 Join 操作时，如果一个表很大，另一个表很小，那么我们就可以把较小的表进行缓存，在每个 TaskManager 都保存一份，然后进行 Join 操作。

那么我们应该怎样使用 Flink 的分布式缓存呢？举例如下：

public static void main(String[] args) throws Exception {

final Execut

了解本专栏

超级会员免费看

王知无(import_bigdata)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

王知无(import_bigdata) 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。