数仓
AudreyHepburn?Yui Aragaki
这个作者很懒,什么都没留下…
展开
-
数仓理论之表
数仓理论之表1.表的分类实体表:一般是指一个现实存在的业务对象,比如用户,商品,商家,销售员等等。维度表:一般是指对应一些业务状态,编号的解释表。也可以称之为码表。比如地区表,订单状态,支付方式,审批状态,商品分类等等。事务型事实表:一般指随着业务发生不断产生的数据。特点是一旦发生不会再变化。比如交易流水,操作日志,出库入库记录等等。交易流水表:编号对外业务编号订单编号用户编号支付宝交易流水编号支付金额交易内容支付类型支付时间1757769794511原创 2020-08-15 19:30:06 · 375 阅读 · 0 评论 -
数仓分层简介
数仓1.数仓分层好处:复杂问题简单化;减少重复开发;隔离原始数据。2.数仓分层具体实现ODS(Operation Data Store)层:原始数据层,存原始数据,直接加载原始日志、数据DWD(Data Warehouse Detail)层:明细数据层也有叫DWI层,结构和粒度与原始表保持一致,对ODS层数据进行清洗(去除空值、脏数据、超过极限范围的数据、行式存储转列式存储、改压缩格式)DWS(Data Warehouse Service)层:服务数据层,以DWD为基础进行轻度汇总。比如:用户当日原创 2020-08-15 19:24:14 · 577 阅读 · 0 评论