你们数据仓库都是怎么设计的,数据怎么抽象?
关于这个问题,我说一说我的想法,不一定是正确的,但希望能给你提供一些思路
1、数据仓库是怎么设计的?
如果真的要完全回答这个问题,真的太大了。
另外我觉得,问这个问题,也不一定就要让你照本宣科,把现在的数仓理论背一遍。更多的是想看你做了哪些有亮点的事,有哪些有亮点的想法。
可以按照自己的习惯,把数仓怎么设计的分成几个模块,比如:
-
技术架构
-
数据流转
-
分层建模
然后,询问一下,面试官重点想要听哪一块?
技术架构方面:
可以从数据采集到数据进入数仓后的etl,再到数据怎么做成数据服务提供给业务方,整个流程的核心技术节点划一遍。
然后,再重点讲一下自己做的模块(做数据治理 or 数据开发 or...),比如说数据开发,就可以讲讲,实际工作中遇到过哪些难点,做过哪些优化,突出自己技术亮点(数开更多的是sql优化,sql优化真的有太多可讲的)。