扫一扫加入大数据公众号和技术交流群,了解更多大数据技术,还有免费资料等你哦
目录
二、 Flink 相比传统的 Spark Streaming 有什么区别?
十一、Flink的并行度了解吗?Flink的并行度设置是怎样的?
十二、Flink的Slot和parallelism有什么区别?
二十、Flink Table & SQL 熟悉吗?TableEnvironment这个类有什么作用
二十、Flink SQL的实现原理是什么? 是如何实现 SQL 解析的呢?
第一部分:Flink 中的核心概念和基础考察
一、 简单介绍一下 Flink
Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。并且 Flink 提供了数据分布、容错机制以及资源管理等核心功能。
Flink提供了诸多高抽象层的API以便用户编写分布式任务:
- DataSet API, 对静态数据进行批处理操作,将静态数据抽象成分布式的数据集,用户可以方便地使用Flink提供的各种操作符对分布式数据集进行处理,支持Java、Scala和Python。
- DataStream API,对数据流进行流处理操作,将流式的数据抽象成分布式的数据流,用户可以方便地对分布式数据流进行各种操作,支持Java和Scala。
- Table API,对结构化数据进行查询