2020年最新大数据面试题,你都会吗?

17 篇文章 29 订阅 ¥39.90 ¥99.00
本文围绕Flink和Spark在大数据处理中的面试问题展开,涉及反压机制、数据处理语义、容错机制、状态管理、数据倾斜处理等核心知识点。同时涵盖Kafka的Offset管理、数据仓库、JVM原理、并发安全等内容,全面考察面试者的专业技能。
摘要由CSDN通过智能技术生成

关注公众号“小晨说数据”,一起学习,一起进步!

1.阐述 Flink 如何处理反压,相比 Storm,Spark  Streaming 提供的反压机制,描述其实现有什么不同?

 

2.阐述流处理引擎提供的三种数据处理语义,解释 Flink  Checkpoint 机制如何保证 Flink 程序结果的 Exactly-Once 语义,描述如何通过两阶段提交协议提供端到端的 Exactly-Once 保证?结合 Kafka 如何构建端到端的 Exactly-Once 处理?

 

3.阐述 Flink 提供的容错机制,解释分布式快照 Chandy  Lamport 算法逻辑,剖析 Flink  Checkpoint 具体实现流程?

 

4.如何处理 Flink 作业频繁重启问题?

 

5.如何优化大状态的 Flink 作业?

 

6.如何排查 Flink Checkpoint 超时问题?

 

7.如何处理 Flink 作业中的数据倾斜问题?

 

8.Flink 反压机制,如何排查反压瓶颈在哪,及如何处理反压问题ÿ

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值