hive 、spark 、flink之想一想

京东云开发者

于 2024-03-26 10:23:50 发布

阅读量261

点赞数 9

文章标签： hive spark flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jdcdev_/article/details/137038128

版权

本文详细介绍了Hive、Spark和Flink这三种大数据处理框架的产生、架构、SQL执行流程以及关键特性，包括任务参数调优、内存管理、数据一致性、Kafka集成等内容，旨在帮助读者理解它们在实际应用中的异同和优化策略。

摘要由CSDN通过智能技术生成

hive

1：hive是怎么产生的？

2：hive的框架是怎么样的？

3：hive 执行流程是什么？

4：hive sql是如何把sql语句一步一步到最后执行的？

5：hive sql任务常用参数调优做过什么？

spark

6：spark 是怎么产生的？

7：spark 框架是怎么样的？

8: spark的DAG是什么？

9：spark中的app，job,stage,task是什么？有什么好处？

10：spark的RDD是什么？与dataframe有什么区别？

11：spark 执行流程是什么？

12：spark sql是如何把sql语句一步一步到最后执行的？

13：spark 与mapreduce的区别是什么？

14： spark的反压原理是什么？主动还是被动？

flink

14：flink是怎么产生的？

15：flink的框架是怎么样的？

16：flink 的内存模型说一说？

17：flink的cp ,sp说一说原理，有什么区别？你们是怎么设置cp的相关参数？

18：flink的四个图是什么？分别都是什么环节对应什么图？

19：flink反压机制，你是如何理解的？你是如何定位、并有什么方案解决？与spark的反压有什么区别？

20：flink的barrier对齐和非对齐是怎么理解的？

21：flink的精准一次和至少一次是怎么理解的？

22：flink任务消费或者写入kafka时，并行度不一致有什么问题？

23：flink如何保证数据一致性？

24：flink对于kafka新增分区时，消费有什么问题吗？

25：flink消费kafka的offset是怎么维护的？自动提交？

26：flink任务如何设置TM，JM的并行度？

27：flink任务做过什么调优？

28：flink任务大状态时做过什么优化？

29：你们用flink做过实时数仓吗？你们的上下游的环境都是什么？全链路时效是多少？

京东云开发者

关注

9
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
hive 、spark 、flink之想一想

19：flink反压机制，你是如何理解的？17：flink的cp ,sp说一说原理，有什么区别？你们的上下游的环境都是什么？9：spark中的app，job,stage,task是什么？25：flink消费kafka的offset是怎么维护的？10：spark的RDD是什么？18：flink的四个图是什么？20：flink的barrier对齐和非对齐是怎么理解的？13：spark 与mapreduce的区别是什么？14： spark的反压原理是什么？21：flink的精准一次和至少一次是怎么理解的？
复制链接

扫一扫

京东云开发者 CSDN认证博客专家

CSDN认证企业博客

1468: 原创

1980: 周排名

593: 总排名

146万+: 访问

: 等级

2万+: 积分

7455: 粉丝

5562: 获赞

385: 评论

6971: 收藏

私信

关注

热门文章

分类专栏

数据库 95篇
软件架构 16篇
敏捷开发 2篇
测试 31篇
人工智能 34篇
低代码 4篇
前端 40篇
数据结构与算法 17篇
安全 19篇
自然语言处理 3篇
rust 2篇
数据迁移 13篇
CDN 4篇
云电脑 5篇
直播延迟 1篇
专有云 2篇
畅谈 87篇
上手实操 74篇
技术分享 384篇
云计算 62篇
区块链 6篇
监控系统 3篇
招聘 1篇

最新评论

一份保姆级的Stable Diffusion部署教程，开启你的炼丹之路
Pluto_ang: kohyass必须要装sdwebui吗
一文读懂Guava EventBus（订阅\发布事件）
一蓑烟雨任平生2024: 创建Subscriber时，如果method含有【@AllowConcurrentEvents】注释，则创建SynchronizedSubscriber，否则创建Subscriber 这里是不是反了
奇怪！应用的日志呢？？
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%,大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
从人工到自动化到AIOps再到ChatOps：大模型在运维领域的应用
征途黯然.: The explanation of 从人工到自动化到AIOps再到ChatOps大模型在运维领域的应用 in this article is vivid, thanks for sharing!
从人工到自动化到AIOps再到ChatOps：大模型在运维领域的应用
Marst·Writer: 运维最初的基本任务就是环境搭建和监控设置,随着自动化和智能化,这些都需要技术人员来完成（云计算和容器技术）.从某种意义上来说,运维的工作都已经被云服务(监控和异常提醒)所替代了,需要运维负责的事情变得更少了.

大家在看

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。