阿里巴巴大数据实践之路
BigDataCoder
这个作者很懒,什么都没留下…
展开
-
事实表设计步骤
采用四步设计方法1. 选择业务过程以及确定事实表类型比如淘宝的订单流转的业务过程有四个:创建订单,买家付款,卖家发货,买家确认收货明确了业务过程后,根据具体业务需求来选择与维度建模有关的业务过程。比如买家付款这个业务过程,那么事实表应只包括买家付款这一个业务过程的单事务事实表总而言之就是选择了哪些业务过程,那么所建立的事实表应为包含了所有业务过程的累积快照事实表 ...原创 2021-07-17 18:24:15 · 1053 阅读 · 0 评论 -
事实表设计之事实表特性
事实表特性事实表是数据仓库维度建模的核心事实表中一条记录所表达的业务细节程度被称为粒度度量业务过程的事实,有可加性,半可加性,不可加性三种类型事实表设计原则尽量包含所有与业务过程相关的事实 只选择与业务过程相关的事实,比如下单这个过程,不应出现支付金额,因其属于支付过程 分解不可加事实为可加的组件,比如折扣率,可分解成原始价格与优惠价格 选择维度和事实之前必须先声明粒度,粒度定义得越细越好 同一个事实表中不能有多个不同粒度的事实,比如一次购物车多个商品下单,不应当存在订单总价的字原创 2021-07-13 23:51:40 · 344 阅读 · 0 评论 -
维度建模之行为维度
HBase就是谷歌bigdata论文中bigtable的实现,相比hdfs和hive,它可以实时读写,并且是nosql数据库系统rowkey是hbase的主键,一般通过rowkey和主键的range来检索数据主要用来存储结构化和半结构化的松散数据,hbase表的特点大:一个表可以有上十亿行,上百万列 面向列:面向列(族)的存储和权限控制,列(族)独立检索。 稀疏:对于为空(null)的列,并不占用存储空间,因此,表可以设计的非常稀疏。 不支持事务 不支持SQL 不支持Join..原创 2021-07-13 23:28:43 · 1074 阅读 · 0 评论