1、SparkSQL有几种join?
2、Hive你怎么做的优化?
3、你确定你这么做真的能保证exactly-once?
4、Hive字段类型不同,会发生什么事?
5、Hive的执行计划看过吗?里面都有什么内容?你怎么看的
6、SS的实时是怎么和离线关联起来的?api吗?任务每天重启?
20210223——某厂大数据开发面经
最新推荐文章于 2024-10-25 11:56:34 发布
本文探讨了SparkSQL中不同的JOIN类型以及如何进行Hive的性能优化。同时,讨论了在大数据处理中如何确保exactly-once语义,并分析了Hive字段类型不匹配可能带来的问题。此外,还涉及到了Hive的执行计划解析及其重要性,以及SS实时与离线任务的整合策略。
摘要由CSDN通过智能技术生成