CDA Level 1 数据结构

前言

该部分对于纯小白,可能会有点难度,但是,也是考试中占比比较高的部分,所以一定要认真学习哇!

数据结构(占比15%)

首先,需要明确区分表格结构数据表结构数据,两个内容就一字之差,不仔细看容易混淆

表格结构数据特征 和 表结构数据特征

        表格结构数据:Excel、WPS、Number(类似Excel的表格软件)

        表结构数据:数据库、ETL工具、可视化工具

表格数据结构

1、表格数据结构—数据类型:数值型(整数、小数)、文本型、逻辑型(true、false)

2、表格文件:CSV(“,”为分隔符)、TXT(制表符为分隔符)、XLSX、ET

3、引用单元格数据:(需注意,定位单元格时,行列写法要统一)

        同一工作表内单元格值:=列号+行号

        其他工作表内单元格值:=工作表名!+列号+行号

4、基本单位数据:单元格

5、Excel常用函数

表数据结构

1、基本单位数据:字段、记录

2、字段:整列数(第一行为标题行),字段名不能重名,一个字段只能有一种数据类型

3、记录:整行数(第二行以后成为记录)

4、维度和度量字段:(重点,后续的篇幅也会涉及)

        维度:业务角度

        维度字段:文本型

        度量:业务行为结果

        度量字段:数值型

5、维度表和事实表:(重点,后续篇幅也会涉及)

        维度表:只包含维度信息的表

        事实表:既包含维度信息又包含度量信息的表

6、表结构数据特点:不同字段记录行数相同

7、主键(索引):

        物理意义:

                一个表中有且只有一个主键

                主键:一个字段构成  或 多字段联合主键

                特点:非空不重复,多以 “xxID”、“xxNo”、“xx编号”等名称命名

                意义:定位记录行

        业务意义:

                表的业务记录单位,在一个数据表中的所有非主键字段都要围绕主键展开

8、“应用”表格结构数据、“引用”表结构数据

9、ETL:抽取、清洗转换、加载

10、DW:存储分析所需的所有数据源上的信息

11、OLAP:连接信息孤岛、创建多维数据模型

12、表结构数据的合并:(对于纯小白可能会有点难度,这里只浅浅记录,后面数据库的章节,会有类似的内容,注意区分,合并的效果会不一样

        对应关系:决定连接结果行数是对应项乘积的结果

        横向合并:通过两个表的公共字段,匹配横向拼接,示例如下

       

        横向合并的方法:左连接、右连接、内连接

                左连接:左表为主表,合并效果如下

                

                右连接:右表为主表,合并效果如下

        

                内连接:取两个表的交集

                         

        纵向合并:多表中记录信息合并到同一个表中进行使用的合并方式

                

13、E-R图:多表连接的鸟瞰图(这里只浅浅了解,后面的章节会讲连接分类比较重要)

14、数据汇总计算规则

        合计规则:相同维度下对应的多个度量值相加、函数代表:SUM

        计数规则:相同维度下的度量个数进行计数、函数代表:COUNT(非空计数)、DISTINCTCOUNT(去重计数)

        平均规则:合计规则 除以 计数规则(平均数=合计/计数)、函数代表:AVERAGE

        最大值规则:相同维度下的最大度量值、函数代表:MAX

        最小值规则:相同维度下的最小度量值、函数代表:MIN

15、

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值