【面经】中邮消费金融大数据开发二面面经

【面经】中邮消费金融大数据开发二面面经

自我介绍
项目的架构讲一下
Spark 调优用过哪些

参数设置和 SQL 代码改写。

Spark 基于内存的,什么时候会写磁盘

mapreduce 任务后期再计算的时候,每一个 job 的输出结果会落地到磁盘,后续有其他的 job 需要依赖于前面 job 的输出结果,这个时候就需要进行大量的磁盘 io 操作。性能就比较低。

spark 任务后期再计算的时候,job 的输出结果可以保存在内存中,后续有其他的 job 需要依赖于前面 job 的输出结果,这个时候就直接从内存中获取得到,避免了磁盘 io 操作,性能比较高。

对于 spark 程序和 mapreduce 程序都会产生 shuffle 阶段,在 shuffle 阶段中它们产生的数据都会落地到磁盘。

Spark 作业提交流程
对数仓建模了解多少,用什么模型
Flink 了解多少
最有成就感的事情
下次遇到这种问题如何解决
压力最大的事情
反问
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值