![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CDA数据分析
文章平均质量分 84
咻~电脑
jzy去睡觉
展开
-
技术学习|CDA level I 业务分析方法
业务分析方法有三个主要构成部分:业务指标分析、业务模型分析及业务分析方法。原创 2024-01-05 23:51:26 · 854 阅读 · 0 评论 -
技术学习|CDA level I 多维数据透视分析
对基于多源表的结构数据进行商业智能分析,可以帮助决策者从多个不同业务角度对业务行为结果进行观测,进而帮助决策者全面、精确地定位业务问题,实现商业洞察的相关内容。通过商业智能分析产出的分析成果被统称为商业智能报表,简称"BI报表"。根据BI报表的展示形式、使用场景等的不同,BI报表又被称为"XXX驾驶舱"、“XXX仪表盘”、“XXX仪表板”、"XXX大屏"等。日常生活中看到的由交互式数据图表界面构成的报表都是BI报表。创建一个BI报表需要先后使用四个不同阶段的软件技术。原创 2024-01-04 22:51:04 · 1069 阅读 · 0 评论 -
技术学习|CDA level I 描述性统计分析(相关分析)
函数关系是指变量之间存在关系、且关系是确定的,即给出一个X,有且只有一个Y与其相对应,则称Y是X的函数。变量之间关系的分析师数据分析非常核心的工作,变量之间关系的研究包括关系存在性研究、关系程度大小研究、关系方向的研究、关系形式的研究、关系传递的研究等。而这里的相关分析是指狭义相关分析,是指用来研究变量之间简单线性相关关系的方法,即研究两个变量的关系,这两个变量之间存在不确定性的关系,这种关系常用直线表示,故这种相关分析也常称简单线性相关分析。没有关系也可以看作是相关关系的极限,是弱相关关系的极限。原创 2024-01-04 22:39:27 · 934 阅读 · 0 评论 -
技术学习|CDA level I 描述性统计分析(常用的数据分布)
推断性统计分析方法的基础理论——常用的分布(两点分布、二项分布、正态分布[含标准正态分布]、χ2分布、t分布、F分布。随机试验:结果不确定的实验,例如,进行一次抛硬币实验,结果是不确定的。对于随机试验的结果,称为随机事件。用于表示随机事件的变量称为随机变量,若随机变量的取值可一一列举,则称为离散型随机变量;若不可一一列举,则称为连续性随机变量。对于多个随机事件,若其结果互不影响,则称其相互独立。概率(Probability):用于描述随机事件发生的可能性的大小,常用符号P表示,如事件X的概率表示为P(X原创 2024-01-03 23:29:10 · 1489 阅读 · 0 评论 -
技术学习|CDA level I 描述性统计分析(数据的描述性统计分析)
技术学习|CDA level I 描述性统计分析(数据的描述性统计分析)数据的描述性统计分析常从数据的集中趋势、离散程度和分布形态3个方面进行。一、集中趋势集中趋势是指数据向其中心值靠拢的趋势。测量数据的集中趋势,主要是寻找其中心值。对不同的数据有不同的测量方法(低级数据的方法,高级数据可以用;高级数据的方法,低级数据不可以用)。1、分类数据的集中趋势的描述众数:一组数据中,出现次数最多的数,符号记为M。性质:①不受极端值的影响。极端值是指一组数据中,偏离数据平均水平的值,分为极大值和极小值两种原创 2024-01-02 22:43:10 · 828 阅读 · 0 评论 -
技术学习|CDA level I 描述性统计分析(统计学概述)
收集数据是数据分析的前提,传统的数据收集方法包括两个来源:直接来源和间接来源,这里的直接和间接强调的是数据是否一手收集,一手收集的数据称为直接来源的数据,二手收集的数据称为间接来源的数据。数据处理环节包括将收集的数据进行数据编码、数据库搭建、数据录入、数据审核(包括数据的完整性、准确性、实效性、适用性等),进而按照研究问题的需要进行数据筛选、数据分组、数据分割、数据合并、数据变形、数据转换等,并进行一些数据质量评估、数据特征分析、数据可视化分析等探索性分析)定距数据的0不表示没有,而定比数据的0表示没有。原创 2024-01-02 22:37:42 · 1012 阅读 · 0 评论 -
技术学习|CDA level I 数据库学习(视图)
对视图内部数据的修改会导致其底层基本表的修改,此操作会带来较大的风险,且修改视图这个操作本身就拥有极大的限制(比如在视图本身的数据其实是映射了底层基本表中多条数据或者多个表的前提下,数据库无法判断修改视图要修改哪条对应的数据,导致视图无法修改,常见情况有去重、聚合函数的使用等);视图可以根据分析流程,将复杂的业务逻辑抽象成查询语句并进行封装,分析人员在使用视图时不需要关心表的结构、连接关系、筛选条件、分组和排序等,只需要对视图进行简单的查询,即可获得分析所需的数据,可以有效降低查询代码的复杂度。原创 2024-01-01 20:01:43 · 928 阅读 · 0 评论 -
技术学习|CDA level I 数据库应用(数据查询语言DQL)
最后确定表和表之间的对应关系和连接关系。使用where声明连接方式对交叉连接的结果进行筛选时,即可以使用不等值的连接条件也可以使用等值的连接条件,在使用等值的连接条件时,返回的结果与内连接返回的结果一致,但因为交叉的运算量非常大,所以在记录数较多的情况下会花费大量的时间来进行运算,所以内连接的情况并不推荐使用where声明连接条件。若expr1的值为false,再判断expr3的值,若expr3的值为true,则返回expr4,以此类推,若所有的when子句后面的条件都不满足,则返回expr的值。原创 2024-01-01 20:00:52 · 423 阅读 · 0 评论 -
技术学习|CDA level I 数据库应用(数据操作语言DML)
而在这里忽略第一行是因为通常来讲,文本文件数据中的第一行是字段名信息,而我们在创建表时已经指定了表名和表中每个字段的字段名,所以只需要导入从第二行开始的数据信息。MySQL除可以导入数据源文件中的数据外,还可以和企业数据库进行连接,直接调用企业数据库中的数据,只需要企业数据库管理员设置好权限之后就可以调用;导入数据后,还需要对数据进行复核和检查(对导入表中的数据一般从导入内容,导入数据总行数及表结构三方面进行检查。update <表名> set <字段1>=<值1> [,<字段2>=<值2>,……原创 2023-12-30 10:45:58 · 489 阅读 · 0 评论 -
技术学习|CDA level I 数据库应用(数据定义语言DDL)
字符串主要用来存储不能进行数字运算的文本数据。--修改字段类型(对字段的类型进行修改时,如果要修改的字段已经存储了数据,那么数据库会检查已存储的数据是否满足新的数据类型的要求,只有在该字段的所有数据都满足新的数据类型的要求的情况下才会成功执行修改命令,如果有任意一行数据不满足要求就会报错,无法进行字段类型的修改【以数值格式存储的字符串,可以强制转换为数值类型】)CHAR和VARCHAR的区别在于,CHAR是固定长度的,每个值占用相同的字节数,针对不足的位数,MySQL会在它的右边用空格字符补足。原创 2023-12-28 20:17:58 · 990 阅读 · 0 评论 -
技术学习|CDA level I 数据库应用(数据库相关概念)
其中ODS层用来存储业务数据库在一个时间范围内新增或更新的数据,相当于业务数据库的一个非实时的缓存,因此其结构与原表结构类似,会对来自不同业务系统产生的数据进行初步的整理,如筛选分析所需的字段、统一不同来源数据的编码等;实际上就是OLTP与OLAP的区别。非关系数据库:非关系数据库是用来存放非结构化数据的数据库,不像关系数据库那样局限于固定的结构,而是采取开放式结构来存储数据,其标准也不像关系数据库那样统一,常用的存储标准有键值对,即键(Key)对应值(Value),且对应的值可以采取不同的长度和类型。原创 2023-12-28 20:14:04 · 762 阅读 · 0 评论 -
技术学习|CDA level I 表格结构数据与表结构数据
结构化数据:数据结构规范、完整的数据,主要产生于企业的业务系统及客户端应用程序,如CRM(客户关系管理)系统、ERP(企业资源计划)系统,电商App等。在使用结构化数据对业务问题进行描述性分析时主要应用的IT工具有电子表格工具、数据库操作语言、ETL工具及数据可视化工具等。结构化数据具有数据信息完整规范、搜索调用简单方便、易于理解等优点,但是因为其主要产生于企业系统,所以其数据范围被圈定在企业系统可触达的业务范围内,如果要对企业系统之外的有用信息进行分析,就要用到非结构化数据。原创 2023-12-27 20:57:43 · 1038 阅读 · 0 评论 -
技术学习|CDA level I 绪论
1、数据分析定义为:用适当的分析方法和挖掘方法对收集来的数据进行研究总结,提取有用的信息,形成结论并支持决策的过程。2、大数据:体量巨大、来源多样、生成极快、复杂多变,并且难以用 传统数据体系进行有效处理。3、数据分析师:在不同行业中从事数据的采集、处理、分析并能制作业务报告,提供商业评估与决策,且具备职业道德和行为素养的专业人士。4、用于商业决策的数据分析方法主要分为业务描述性分析与数据挖掘分析方法两大类。原创 2023-12-27 00:15:56 · 403 阅读 · 0 评论