CDA Level 1 数据分析师:2.2 表结构数据特征
1. 表结构数据
1. 表结构数据
字段:整列数
记录:整行数
维度:业务角度
度量:业务行为结果
维度字段:文本型(状态)
度量字段:数值型(交易结果)
2. 事实表及维度表
维度表:只包含维度,只是描述性(产品表,品牌表,客户表)
事实表:包含维度和度量(销售,采购,库存都有交易情况和金额数量)
3. 表结构特征
1. 以字段或记录作为数据的引用、操作及计算的基本单位的数据
1. 第一行为:字段名(唯一)
2. 第二行以后成为:记录
3. 字段不能重名
4. 一个字段有一种类型(整列都是一个类型)
2. 所有字段记录行数相同
1. 方形结构(数据要完整,是一个矩阵,连续方形排列;有空值占位NULL)
2. 记录行数相同
3. 处理缺失值:
文本型:
1. 影响不大:忽略或替换
2. 影响大:与业务员确认后替换或核实后删除
数值型:
应用环节展开
3. 一个表有且只有一个主键
1. 主键物理意义:
1. 单字段主键:一个字段构成
2. 多字段联合主键
3. 非空不重复(主键不能存在NULL,主键唯一)
4. 定位记录行、字段名+主键值定位具体数值
5. 以 XXID,XXNo,XX编号 为命名
2. 业务意义:
1. 表的业务记录单位。在一个数据表中所有非主键的字段都围绕主键展开
4. 确定主键
1. SQL语句找出
2. 数据表设计者的设计资料
3. 通过业务意义推测主键(非空不重复)