最近工作太忙了,有很多人和我说,哎呀博主啊,你这个是阉割了嘛,怎么就写了一篇啊,没下文了啊?其实不是的,最近工作真的是太忙了,到新公司,很多事情,而且家里事情很多。那现在就给大家出点数仓的面试题吧,希望帮到大家。之后具体的学习流程呢,我会出的,有时间一定出。大家不要催。
本面试题仅仅为本人和别人讨论下来的面试题,不作为任何公司的面试题。(如有雷同,纯属巧合)
- 你现在公司的数仓整体架构,分层情况,为何这么建模。
- join的表中筛选和where中筛选有什么区别 (就是left join后,条件卸载join后和where后,结果集有什么区别)
- 范式建模和维度建模的区别,应用场景的区别,优缺点。
- 手写sql,基本上是实现排序分组去top5的类型,(就是row_number分组后,取TOP_N)
- 数据倾斜是如何产生的,怎么优化?
- 数据治理做过哪些,怎么做的?