前言
该部分对于纯小白,可能会有点难度,但是,也是考试中占比比较高的部分,所以一定要认真学习哇!
数据结构(占比15%)
首先,需要明确区分表格结构数据和表结构数据,两个内容就一字之差,不仔细看容易混淆
表格结构数据特征 和 表结构数据特征
表格结构数据:Excel、WPS、Number(类似Excel的表格软件)
表结构数据:数据库、ETL工具、可视化工具
表格数据结构
1、表格数据结构—数据类型:数值型(整数、小数)、文本型、逻辑型(true、false)
2、表格文件:CSV(“,”为分隔符)、TXT(制表符为分隔符)、XLSX、ET
3、引用单元格数据:(需注意,定位单元格时,行列写法要统一)
同一工作表内单元格值:=列号+行号
其他工作表内单元格值:=工作表名!+列号+行号
4、基本单位数据:单元格
5、Excel常用函数
表数据结构
1、基本单位数据:字段、记录
2、字段:整列数(第一行为标题行),字段名不能重名,一个字段只能有一种数据类型
3、记录:整行数(第二行以后成为记录)
4、维度和度量字段:(重点,后续的篇幅也会涉及)
维度:业务角度
维度字段:文本型
度量:业务行为结果
度量字段:数值型
5、维度表和事实表:(重点,后续篇幅也会涉及)
维度表:只包含维度信息的表
事实表:既包含维度信息又包含度量信息的表
6、表结构数据特点:不同字段记录行数相同
7、主键(索引):
物理意义:
一个表中有且只有一个主键
主键:一个字段构成 或 多字段联合主键
特点:非空不重复,多以 “xxID”、“xxNo”、“xx编号”等名称命名
意义:定位记录行
业务意义:
表的业务记录单位,在一个数据表中的所有非主键字段都要围绕主键展开
8、“应用”表格结构数据、“引用”表结构数据
9、ETL:抽取、清洗转换、加载
10、DW:存储分析所需的所有数据源上的信息
11、OLAP:连接信息孤岛、创建多维数据模型
12、表结构数据的合并:(对于纯小白可能会有点难度,这里只浅浅记录,后面数据库的章节,会有类似的内容,注意区分,合并的效果会不一样)
对应关系:决定连接结果行数是对应项乘积的结果
横向合并:通过两个表的公共字段,匹配横向拼接,示例如下
横向合并的方法:左连接、右连接、内连接
左连接:左表为主表,合并效果如下
右连接:右表为主表,合并效果如下
内连接:取两个表的交集
纵向合并:多表中记录信息合并到同一个表中进行使用的合并方式
13、E-R图:多表连接的鸟瞰图(这里只浅浅了解,后面的章节会讲连接分类比较重要)
14、数据汇总计算规则
合计规则:相同维度下对应的多个度量值相加、函数代表:SUM
计数规则:相同维度下的度量个数进行计数、函数代表:COUNT(非空计数)、DISTINCTCOUNT(去重计数)
平均规则:合计规则 除以 计数规则(平均数=合计/计数)、函数代表:AVERAGE
最大值规则:相同维度下的最大度量值、函数代表:MAX
最小值规则:相同维度下的最小度量值、函数代表:MIN
15、