前言
昨天群里突然有人问了一个这个问题:
我最早听说 ELT 的时候也楞了一下,只不过简单琢磨了一下就放下了。今天重新听到,其实也没啥感觉。
反正有人也给出了最言简意赅的解释:
只是换个顺序?
然后就有人蒙圈了啊!这都行?
还有人猜:
额。。。其实吧, ETL 和 ELT 还真的只是顺序不一样。
ETL 是Extract(抽取)、Transform(转换)、Load(加载);
ELT 是Extract(抽取)、Load(加载)、Transform(转换)。
你是不是会感觉这帮搞数仓的整天就知道装神弄鬼,整点新词儿忽悠人!
额...你要是这么想,那可就小看了我们数仓人了,小看了架构这件事情了。来,我今天就给你细细的讲一讲 ETL 和 ELT 到底是咋回事。
你可以瞧不起我,但是你不能瞧不起我的专业!
那时候...
老数仓人做项目,都是一板一眼,很有章法的。
我们一般会先从业务系统开始调研,摸清楚所有数据来源的数据结构。
同时会去了解业务流程,看看业务到底是怎么运转的,系统又是怎么留痕的,这样两下验证,逻辑上就通了。
其实到这一步,我们就能知道很多信息了,经验丰富的人基本上已经在脑子里猜到用户的需求,开始设计报表了。
那下一步自然是去获取用户需求,规划上面的即席查询、多维分析、固定报表、仪表盘啥的数据应用了。
然后就是各种的分主题域、分层、逻辑模型咔咔一顿操作猛如虎。
如果您还有印象,应该记得我之前写过数仓建设步骤: