数据建模,我们经常会碰到使用维度表。为了能够追踪历史,我们通常有两种方法:一种是用时间戳(起始生效日期和结束日期),一种是使用是否当前有效的字段标记。这里使用这些字段的目的,在于采集事实表时,能根据这些标记查找对应的维度记录ID(通常使用代理键,不要使用自然键,并且更新时应该先更新维度表,在更新事实表)。
但是我们经常会碰到存在层次关系的维度,在这些维度记录中通常通过ID作为层次关系的根据。如下图所示的维度物理表:
设置好层次关系。
选中属性列表中的属性,设置部门,分公司,人员对应的显示名称(选中上面属性行,在属性窗口的“NameColumn”属性进行设置)。
查看结果如下:
加入现在2010-12-3日,市场部的名字更改成了“销售部”。更通过渐变维度更新,最将记录1、2的有效结束日期更改为2010-12-3日,并添加两条新的记录。如下图所示:
注意:记录3没有做任何改动,如果2010-12-3日进行事实表更新,则事实表中关联的ID为3、4、5而不再是1、2、3。
如果我们此时重新更新维度,更新到SSAS服务器,则会报错“OLAP 存储引擎中存在错误: 处理时找到重复的属性键: 表:“dbo_人员维度”,列:“部门ID”,值:“1001”。该属性为“部门ID”。”
因为更新维度时,1001对应另个名字“市场部”“销售部”。我们必须对老的记录和新记录的数据进行“隔离”。
选中属性列表中的部门ID设置“键列”(设置属性窗口中的KeyColumns),我们看到只有“部门ID”,把“有效开始时间”也放进来变成组合键列,并且人员也进行同样的设置。最顶级别的“分公司ID”则用“分公司ID”和“分公司名称”做为组合键。
更新到服务器后,可以看到如下的层次结构:
有些人会说,当前“市场部”已经不要了,怎么还出来了。其实这个没关系,因为我们查看事实表的时候有个时间维度,选定一个日期关联的事实表,而同一天的这些事实表不可能同时有关联“市场部”又有关联“销售部”的。
总之:最高级别的“分公司”的键列为“分公司ID”+“分公司名称”;其他的键列为“ID”+“有效其实日期”。
大家踊跃发言,批评指正!!