文章目录
表结构数据
以字段或记录作为数据的引用、操作及计算的基本单位的数据
- 字段:整列数
- 记录:整行数
- 维度:业务角度
- 度量:业务行为结果
- 维度字段:文本型
- 度量字段:数值型
事实表及维度表
维度表:只包含维度信息的表
事实表:既包含维度信息又包含度量信息的表
表结构数据特征-1
以字段或记录作为数据的引用、操作及计算的基本单位的数据
- 第一行为标题行
- 第二行以后称为记录
- 字段名不能重名
- 一个字段只能有一种数据类型
表结构数据特征-2
所有字段记录行数相同
- 方形结构
- 记录行数相同
- 存在空值
- 处理缺失值
处理缺失值-1
根据数据类型以及生成信息重要程度的不同,使用不同的方法处理缺失值
-
文本型字段
-
影响不大:以选择不进行处理,或者也可以用其他没有实际业务含义的文本字符对缺失值进行替换
-
影响大:招业务人员进行确认后替换,或者与业务人员核实后删除
-
数值型字段
-
综合考虑该数值型字段所代表的度量意义以及针对该数值型字段进行汇总计算的方式来最终决定对缺失值的具体处理方法