(二)CDA 数据分析师Level1考试新版大纲解析(自己整理)PART 2 数据结构

本文深入探讨了表格和表结构数据的特征、获取方法及应用。内容包括表格结构的基本单位、数据引用与查询,以及表结构的主键、维度与度量概念。还介绍了数据连接、汇总逻辑及E-R图在多表操作中的作用。强调了数据处理的效率、缺失值管理和批量处理的重要性。
摘要由CSDN通过智能技术生成

PART 2 数据结构(占比 15%)

总体要求

理解表格结构与表结构的数据特征、理解表结构与表结构数据获取操作方法、理解表结构数据连接及汇总的逻辑、能够应用表结构连接及汇总逻辑关联多表进行汇总求值计算、能够制作 ER 关系图


1、表格结构数据特征(占比 2%

【领会】

表格结构数据概念

表格结构数据处理工具

EXCEL、Numbers、WPS

【熟知】

表格结构数据特征

1.单元格为基本数据存储及操作单位

2.处理批量数据效率低

可以引用其他工作表和工作簿中的单元格值进行计算

对象间的父子级关系:一个父级对象下包含多个不同子级对象,一个子级对象只能属于某一特定的父级对象。

月份对应多个星期的同时星期也属于多个不同月份,所以两者间不具备父子级关系


2、表格结构数据获取、引用、查询与计算(占比 3%

【领会】

表格结构数据获取方法

数据库系统、前端操作平台(ERP、CRM、财务系统)、企业外部渠道

电子表格支持的数据文件:csv、txt、xlsx、ET

表格结构获取数据方式:应用

【熟知】

单元格区域的特征

【应用】

表格结构数据的引用方法

引用同一工作表内单元格值:“=列号+行号”如 “=A1”

引用不同工作表单元格值:“=表名!+列号+行号”如“=Sheet2!A1”

引用同一工作表内单元格区域:“=左上单元格:右下单元格”如“K4:M7”

引用不同工作表内单元格区域:“=表名!左上单元格:右下单元格”如“=Sheet2!K4:M7”

引用多行:“=上边行号:下边行号”

引用多列:“=左边列号:右边列号”

表格结构数据的查询方法

使用查询函数vlookup()

如“=vlookup(F4,A:B,2,False)”

表格结构数据的常用函数

函数构成:等号、函数表达式、参数、操作符、返回值

数学函数:int mod round abs sqrt rand(随机数) Randbetween

文本函数:mid left right len text rept replace subtitle

统计函数

逻辑函数:if and or 如“=if(And(E2>=60,F2>=60,G2>=60),”通过”,”不通过”)”

日期函数

查找与引用函数


3、表结构数据特征(占比 5%)

【熟知】

理解主键的意义

理解维度及度量的意义

字段:整列数

记录:整行数               

度量:业务行为结果,用来描述业务结果程度  维度字段:文本型

维度:业务角度,用来描述业务不同侧面 度量字段:数值型

度量是数据表中的数值数据,维度是类别数据。

汇总结果由维度、度量、汇总规则决定

事实表:既包含维度信息又包含度量信息。如销售表、采购表、库存表、订单表、订单详情表。表格里存储了能体现实际数据或详细数值,一般由维度编码和事实数据组成。

维度表:只包含维度信息的表。如客户表、产品表、品牌表

一表出维度,多表出度量:不同的维度下看不同的度量值,维度就是筛选,用来筛选度量值的,那维度选用的字段必须是来自一表里面的,度量值的字段必须是来自多表的,是字段一般要取自哪个表里。

理解缺失值

Null值影响计算精度

计算机无法确保计算结果

阅读者无法理解

空值行可以删除(处理缺失值)

空值是空白值的简称
空值可能由前端系统非必填项产生

表结构数据特征

  1. 以列(字段)为基本数据存储及操作单位,所有字段记录行数相同
  2. 有且只有一个主键

     3.易于批量处理大量数据 

表结构数据与表格结构数据差异


4、表结构数据获取、加工与使用  (占比 5%)

【领会】

表结构数据获取渠道及方法:数据库 数据仓库 可视化工具

CSV、数据库、Excel、网页

表结构获取数据方式:引用

【熟知】

表结构数据连接逻辑

横向合并:将不同表中的字段信息合并到同一个表使用

                  通过公共字段匹配

                  左连接、右连接、内连接

                  行数是对应项乘积的结果

纵向合并:多表中记录信息合并到同一个表进行使用

                  字段个数和类型相同

Union去重合并 union all 全合并

表结构数据汇总逻辑

数据透视表:维度、度量、汇总计算规则

维度筛选度量,度量被维度筛选

聚合函数:SUM COUNT AVERAGE MAX MIN

count是非空计数,应尽量针对非空字段(主键)计数

【应用】

应用 E-R

多表连接的鸟瞰图

连接线指向各自的公共字段

1代表1表,*代表多表

计算两表连接汇总值

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值