【面经】中邮消费金融大数据开发二面面经

最新推荐文章于 2024-09-14 22:07:12 发布

和风与影

最新推荐文章于 2024-09-14 22:07:12 发布

阅读量523

点赞数

分类专栏：面试文章标签：大数据金融 spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45545090/article/details/127679356

版权

面试专栏收录该内容

46 篇文章 8 订阅

订阅专栏

【面经】中邮消费金融大数据开发二面面经

自我介绍

项目的架构讲一下

Spark 调优用过哪些

参数设置和 SQL 代码改写。

Spark 基于内存的，什么时候会写磁盘

mapreduce 任务后期再计算的时候，每一个 job 的输出结果会落地到磁盘，后续有其他的 job 需要依赖于前面 job 的输出结果，这个时候就需要进行大量的磁盘 io 操作。性能就比较低。

spark 任务后期再计算的时候，job 的输出结果可以保存在内存中，后续有其他的 job 需要依赖于前面 job 的输出结果，这个时候就直接从内存中获取得到，避免了磁盘 io 操作，性能比较高。

对于 spark 程序和 mapreduce 程序都会产生 shuffle 阶段，在 shuffle 阶段中它们产生的数据都会落地到磁盘。

Spark 作业提交流程

对数仓建模了解多少，用什么模型

Flink 了解多少

最有成就感的事情

下次遇到这种问题如何解决

压力最大的事情

反问

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。