Power BI 数据模型——创建表间关系

6 篇文章 0 订阅
5 篇文章 0 订阅
1、为什么要建立表间关系
  • 表之间的关系是数据模型的核心,它允许跨表进行数据分析
  • 在A和B两个表之间建立关系后,才能用A表的字段去筛选或聚合B表中数据,反过来也是一样。

2、创建关系的方式
  • 自动检测:Power BI在加载数据时会尝试自动检测和创建关系。(但这种关系创建往往是直接在不同表的同名字段间创建关系,不一定是我们想要的关系,还可能会导致后续数据分析的错误。因此需要进行检查和调整)
  • 手动创建:在“模型”视图中,可以通过拖拽来手动建立或调整表之间的关系。

3、关系类型:一对一、一对多、多对多
  • 两个表的对应关系,关系是有次序的,分为左表和右表,两个表之间有多对一、一对一、一对多和多对多四种关系,具体说明如下。
    • 多对一(*:1):这是最常见的类型,代表左表中的关系列有重复值,而在右表中是单一值。通常左表是事实表,右表是维度表
    • 一对一(1:1):左表和右表关系列中的值都是唯一的。不建议使用,因为如果两个表之间是一对一的关系,那更好的方法是把这两个表合并成一个。
    • 一对多(1:*):与多对一正好相反。
    • 多对多(*:*):左表和右表关系列中均有重复值,尽量避免使用这种关系.

事实表

维度表

包含观测或事件数据值,例如订单表

包含事实表中数据相关的描述性信息,如产品表

事实数据表可以包含多个重复值,例如日期、产品、用户等都会重复出现

维度表必须包含一个非重复维度列

事实表通常较大

维度表通常较小,受限于可以筛选和分组的项数。例如,日期表、地区表的项数都是有限的

数据表用于执行数学运算,将数据用于聚合(SUM、AVERAGE、MIN、MAX)

维度表用于对事实数据表中的数据进行筛选和分组

以日期和数字为主,如销售额、数量和价格之类的量化数据

内容以文本为主,如产品、地区、日期等

较高的更新频率

较低的更新频率

4、交叉筛选方向
  • 单向交叉筛选:关系中只有一个表可用于筛选数据。例如,表 1 可以按表 2 进行筛选,但表 2 不能按表 1 进行筛选。筛选方向由关系箭头方向确定。通常是一对多单向交叉筛选,即用一端的表(通常是维度表)去筛选多端的表(通常是事实表)。
  • 双向交叉筛选:关系种的两个表,都可以用来筛选另一个表的数据。例如,可以通过事实数据表筛选维度表,也可以通过维度表筛选事实数据表。
    • 一般不建议使用双向交叉筛选关系(除非你真的需要,而且很清楚它会造成的效果),启用它可能导致多义性、意外结果以及性能降低。

5、活动状态和非活动状态
  • 表之间可以存在多个关系,但同时只能有一个关系处于活动状态(在模型关系图中用实线表示),其他的关系则处于非活动状态(用虚线表示)。

6、创建关系的要求
  • 尽量避免多对多关系。
  • 尽量避免双向关系。
  • 避免在数据表之间创建关系。
  • 9
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值