数据仓库:是支持数据存储和进行大批量数据分析的数据环境。
数据集市:按照需求进行处理的后的数据,直接面向决策分析的数据集合在一起。
事实表:事实表其实质就是通过各种维度和一些指标值得组合来确定一个事实的,
比如通过时间维度,地域组织维度,指标值可以去确定在某时某地的一些指标值怎么样的事实。
事实表的每一条数据都是几条维度表的数据和指标值交汇而得到的。
维度表:维度表可以看成是用户用来分析一个事实的窗口,
它里面的数据应该是对事实的各个方面描述,比如时间维度表,它里面的数据就是一些日,周,月,季,年,日期等数 据,维度表只能是事实表的一个分析角度。
OLAP:联机分析处理
问题扩展
分区表、(是否分区)
分桶表、(是否分桶)
外部表、内部表、(位置)
Text表、ORC表、CSV表(表的存储格式)
结合项目中使用
在项目中创建的表,并不是单一的某类表,都是一些属性的聚合,比如外部分区表,内部分桶表等,需要根据原始数据
和业务需求确定可以创建什么类型的表。