1.事实表和维表
维表是用户分析决策的角度,事实表是分析主体的量化体现。
维表是描述问题的某一单一角度,事实表的多个维度的综合。
2.DDTA
我们已知:事实表一般比维表大,在事实表的外键上做Join操作,由于这个已知的事实,提出DDTA的Join算法
对事实表 按照 维表的主键 进行分组,
涉及数据结构:
bitvec:位置指示向量,维表过滤向量;
col输入向量,事实表外键;
res输出向量,中间结果;
1.将维表上做filter操作后,得到vector数组
2.逐个取出事实表的每个元组的外键(若是面向列的直接取出相应地列即可),外键的值就是维表的主键,即维表的索引,按得到的索引 查找bitvec 得知是否留下相应地值,即 可否得到连接结果