我先在基本上是采用kimball的方法进行数据仓库的建模,其中有这么一个问题:
我的一个"人员维度"--记录了类似CRM系统的客户的各类信息--这个维度表的记录将达到近亿条,业务中,每一个人员都是有单位归属的,单位也有相应 的一些分析需要的属性,而且单位的数量也应该是百万级别的,从单位角度分析人员这个主体也是分析的要求之一,现在的问题是,是按照退化维度表的方式处理 成一个维度表呢,还是按照雪花型的方式处理好呢? 另外,还有一个地域维度的处理问题,单位是有地域归属的,人员也是有地域归属的,每个人的服务机构也是有地域归属的,比如说,单位所在地为A地,某甲工 谢谢,请大家多多指教,不胜感激!!!
您需要先
登录才能发帖。
要发帖子,您需要先
加入此论坛。
请先在
订阅设置页上更新您的昵称,然后再进行发帖。
请先在
订阅设置页上更新您的昵称,然后再进行发帖。
|
![]() |
谈谈我的一些想法。
对于你的第一个问题,人员和单位的问题,我觉得可以做雪花处理。 对于你的第二个问题,人员有地域维度,单位有地域维度,服务机构也有地域维度的问题,我觉得也可以做雪花处理。 对于你的第三个问题,如果地域维度不单独建表的话,如何维护分散在不同的维度表中的地域信息的一致性问题。 |
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/8227599/viewspace-932929/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/8227599/viewspace-932929/