转载：解耦宽表体系

最新推荐文章于 2021-09-02 15:07:19 发布

cuanqian4378

最新推荐文章于 2021-09-02 15:07:19 发布

阅读量153

点赞数

数据仓库应用中，宽表模型以结构简单，模型容易理解，数据访问效率等优势，被业界广泛采用。所谓宽表就是，基于某个实体分析对象而建立的一个逻辑数据体系，由实体的维度、描述信息、以及基于这个实体一系列度量组成。它是一个逻辑的概念，在物理实现中不可能就针对一个实体对象建立一个大宽表。因为这样，对于，刷新效率，容错能力，扩展能力都是一个很大的挑战，如何设计和组织宽表的体系结构呢？

其实，我们回到软件设计的基本思想-高内聚，低耦合。我们要从在业务、ETL刷新、指标属性、数据来源等角度，让高度内聚的属性、描述、度量放在一个表中。基本可以从两个维度矩阵进行切割：

第一：按实体属性可能涉及的业务范围进行划分

第二：按业务指标的历史周期属性进行划分，在历史周期上我们可以分为以下几类：

当前用户的基本属性和维度，数据相对静态，修改较少。统计的集合包括所有实体对象。
用户在统计日发生的行为度量指标。这类数据可以根据行为的增量数据就是，统计集合仅仅是当前统计日发生过行为的实体对象。
用户在最近一个周期内的度量指标累计，它由统计日发生的行为度量指标在历史上聚合而成。可以根据业务需要可以就是自然月，自然周。或是最近周、最近月移动聚合数据。它统计的集合是最近一段时间内发生过行为的实体对象。
根据用户历史行为而衍生出的度量维度以及用户当前存量类指标（比如余额，总的产品数，当前总的帐户数）比如第一行为的时间，最后一次行为的时间，统计的集合包括所有发生过一次行为的实体对象。

[@more@]

来自 “ ITPUB博客 ” ，链接：http://blog.itpub.net/22556479/viewspace-1044944/，如需转载，请注明出处，否则将追究法律责任。

转载于:http://blog.itpub.net/22556479/viewspace-1044944/

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。