PART 2 数据结构(占比 15%)
总体要求
理解表格结构与表结构的数据特征、理解表结构与表结构数据获取操作方法、理解表结构数据连接及汇总的逻辑、能够应用表结构连接及汇总逻辑关联多表进行汇总求值计算、能够制作 ER 关系图
1、表格结构数据特征(占比 2%)
【领会】
表格结构数据概念
表格结构数据处理工具
EXCEL、Numbers、WPS
【熟知】
表格结构数据特征
1.以单元格为基本数据存储及操作单位
2.处理批量数据效率低
可以引用其他工作表和工作簿中的单元格值进行计算
对象间的父子级关系:一个父级对象下包含多个不同子级对象,一个子级对象只能属于某一特定的父级对象。
(月份对应多个星期的同时星期也属于多个不同月份,所以两者间不具备父子级关系)
2、表格结构数据获取、引用、查询与计算(占比 3%)
【领会】
表格结构数据获取方法
数据库系统、前端操作平台(ERP、CRM、财务系统)、企业外部渠道
电子表格支持的数据文件:csv、txt、xlsx、ET
表格结构获取数据方式:应用
【熟知】
单元格区域的特征
【应用】
表格结构数据的引用方法
引用同一工作表内单元格值:“=列号+行号”如 “=A1”
引用不同工作表单元格值:“=表名!+列号+行号”如“=Sheet2!A1”
引用同一工作表内单元格区域:“=左上单元格:右下单元格”如“K4:M7”
引用不同工作表内单元格区域:“=表名!左上单元格:右下单元格”如“=Sheet2!K4:M7”
引用多行:“=上边行号:下边行号”
引用多列:“=左边列号:右边列号”
表格结构数据的查询方法
使用查询函数vlookup()
如“=vlookup(F4,A:B,2,False)”
表格结构数据的常用函数
函数构成:等号、函数表达式、参数、操作符、返回值
数学函数:int mod round abs sqrt rand(随机数) Randbetween
文本函数:mid left right len text rept replace subtitle
统计函数
逻辑函数:if and or 如“=if(And(E2>=60,F2>=60,G2>=60),”通过”,”不通过”)”
日期函数
查找与引用函数
3、表结构数据特征(占比 5%)
【熟知】
理解主键的意义
理解维度及度量的意义
字段:整列数
记录:整行数
度量:业务行为结果,用来描述业务结果程度 维度字段:文本型
维度:业务角度,用来描述业务不同侧面 度量字段:数值型
度量是数据表中的数值数据,维度是类别数据。
汇总结果由维度、度量、汇总规则决定
事实表:既包含维度信息又包含度量信息。如销售表、采购表、库存表、订单表、订单详情表。表格里存储了能体现实际数据或详细数值,一般由维度编码和事实数据组成。
维度表:只包含维度信息的表。如客户表、产品表、品牌表。
一表出维度,多表出度量:不同的维度下看不同的度量值,维度就是筛选,用来筛选度量值的,那维度选用的字段必须是来自一表里面的,度量值的字段必须是来自多表的,是字段一般要取自哪个表里。
理解缺失值
Null值影响计算精度
计算机无法确保计算结果
阅读者无法理解
空值行可以删除(处理缺失值)
空值是空白值的简称
空值可能由前端系统非必填项产生
表结构数据特征
- 以列(字段)为基本数据存储及操作单位,所有字段记录行数相同
- 有且只有一个主键
3.易于批量处理大量数据
表结构数据与表格结构数据差异
4、表结构数据获取、加工与使用 (占比 5%)
【领会】
表结构数据获取渠道及方法:数据库 数据仓库 可视化工具
CSV、数据库、Excel、网页
表结构获取数据方式:引用
【熟知】
表结构数据连接逻辑
横向合并:将不同表中的字段信息合并到同一个表使用
通过公共字段匹配
左连接、右连接、内连接
行数是对应项乘积的结果
纵向合并:多表中记录信息合并到同一个表进行使用
字段个数和类型相同
Union去重合并 union all 全合并
表结构数据汇总逻辑
数据透视表:维度、度量、汇总计算规则
维度筛选度量,度量被维度筛选
聚合函数:SUM COUNT AVERAGE MAX MIN
count是非空计数,应尽量针对非空字段(主键)计数
【应用】
应用 E-R 图
多表连接的鸟瞰图
连接线指向各自的公共字段
1代表1表,*代表多表
计算两表连接汇总值