木东居士谈数仓的学习方法!
0x00 前言
以前居士的读者都是工作了三五年的数仓的朋友,一般不怎么学习数仓的问题,更多是直接解决问题,最近来了很多新入行的朋友,因此居士也收到了很多对如何学习数仓的疑问。
为了避免重复回答类似的问题,就和大家简单聊一下数仓怎么入门吧或者可以理解为居士自己的学习数仓的方法。
其实道理很简单,就是理论+案例+实践+沉淀,但是很多道理看着是简单,大家却会对该如何实行摸不到头脑,因此,本文就是解释如何去实行。
关于木东居士和数据仓库
开始之前,先介绍一下木东居士,居士是在14年开始接触数据仓库,差不多也有5年多的数仓经历,这5年的数仓经历可以分为三个阶段:
前两年是互联网行业的数据仓库建设,主要是关于如何在大数据体系下构建一套数据仓库体系。
中间两年补了传统行业的数据仓库理论,并结合到互联网数仓的建设中(更多的是传统行业的建模理论)
第三年之后,开始从数仓的应用角度入手,在数据分析和运营、用户画像、推荐系统的构建和结合层面上,将对数仓的理解反哺于数仓的建设。(这一段经历,居士认为是对数仓领域的升华,视角不同,之前对数仓的理解完全不同。)
15年的时候,网络里面,极少有关于大数据体系下数据仓库的文章,基本都是大数据组件如何安装等等,大家所讨论的数仓,不要说元数据管理这些数据治理相关的内容,连数据分层的文章都很好。
因此居士关于数仓的学习,主要是参考数据仓库那几本经典的书,并加上在公司里面的实践。这点后面给大家。
0x01 理论
理论的话嘛,先厚颜无耻地推荐自己的文章,怎么说呢,居士的很多文章也算是关于互联网行业数据仓库比较早的一些文章了,帮大家入门来理解是足够的。