CDA Level I考试系列2------数据分析概述与职业操守
1.1、综述
数据分析概述与职业操守,本部分内容总共占考试比重为3%左右,主要为常识性内容,读者只需要花费少量时间,对相关概念进行了解即可。
1.2、数据分析概述
数据分析概述提到两个关键概念,大家需要熟悉,分别是数据分析和大数据:
- 什么是数据分析: 数据分析(Data Analysis)可以被定义为:用适当的分析方法和挖掘方法对收集来的数据进行研究总结,提取有用的信息,形成结论并支持决策的过程。
- 大数据(Big Data):体量巨大、来源多样、生成极快、复杂多变,并且难以用传统数据体系结构进行有效处理。
1.2.1、数据分析的分类
用于商业决策的数据分析方法主要分为业务描述性分析方法与数据挖掘分析方法两大类。
- 业务描述性分析:业务描述性分析是①以数据为分析对象,②以探索数据内的有用信息为主要途径,③以解决业务需求为最终目标,包含业务理解、数据采集、数据清洗、数据探索、数据可视化、数据建模、模型结果可视化、分析结果的业务应用等步骤在内的一整套分析流程。
- 数据挖掘:是一个横跨计算机、数学、统计学等学科的科学分支。他使用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现信息的计算过程。数据分析的工作内容涵盖数据挖掘的工作内容。
数据分析在企业中可分为宏观分析和微观分析两大类。
- 宏观分析:站在企业经营和运营的视角,为决策层和管理层提供数据支持。
- 微观分析:站在客户的视角,进行客户洞察,挖掘客户需求和匹配产品与服务,落地自动触发策略。
数据分析的分类如下图所示:
附加内容:CDA各级考试对考生的能力要求如下
这部分内容不属于考试范围,但是了解后有助于针对不同级别考试做不同的准备。
- CDA Level I:要求考生掌握的知识主要以解决业务宏观层面的问题为主,通过对业务数据进行描述性分析,帮助经营决策层及时发现宏观业务问题、做出正确判断、及时解决问题,最终达到帮助企业提高经济收益的目的。
- CDA Level II:考试内容涉及宏、微观相结合的分析,要求考生掌握数据治理和商业分析方法;能够争对不同的业务提出基于统计模型及数据模型的解决思路,根据不同的数据业务需求选择合适的算法进行分析与处理;能够完整准确的输出数据分析报告,实现数据模型落地。
- CDA Level III:考试内容主要涉及微观个体分析,要求考生掌握算法模型和数据特征处理方法,能够针对不同的应用场景提出基于算法模型的解决思路;掌握文本、图像、声音等非结构化数据的分析方法;能够完整准确的输出分析结果,实现模型落地;能够紧跟业务与技术发展方向,时刻站在行业前沿。
1.2.2、数据分析的基本流程
1)业务描述性分析流程概述
业务描述性分析,它分为业务理解、数据获取、数据处理、数据分析、结果展现等5个流程步骤。
- 业务理解:全面、准确理解业务问题及业务需求,并结合需求定制完整分析计划。
- 数据获取:基于业务分析需求,从多渠道全面获取分析数据。直接获取到的、未经过加工的数据称为“原始数据(Raw Data)”。
- 数据处理:对原始数据进行清洗、加工,以提高数据质量。
- 数据分析:对数据处理过后的数据进行业务描述性分析。
- 结果展现:将分析结果以业务分析报告、可视化分析报表(仪表盘、商业智能报表等)的形式呈现给业务决策者。在结果展现环节要求内容准确、客观、全面、直观、易懂。
业务描述性分析技能分为:业务分析方法、数据分析方法、工具应用技能三类。技能矩阵如下图所示:
2)数据挖掘流程
本部分内容不在CDA Level I考试范围之内,在以后的系列文章中做讲解。
1.2.3、数据分析的落地方法
CDA提出企业引入数据分析的落地模板:EDIT数字化模型,如下图所示:
-
业务运行探索(E)
业务运行探索关注各个项目的运行状态、各项指标是否合规及各项业务的具体数据等。 -
问题原因诊断(D)
当业务指标偏离正常值时,采用定性和定量相结合的方式,在中、微观层面定位分析问题。既是指识别出到底是哪些因素显著影响了该业务指标变化。 -
业务策略指导(I)
确定业务目标后,引入数字化的方法来更好地指导优化业务策略。利用已有知识库、策略库、流程模板等可以便捷地定制优化策略。 -
数据算法工具(T)
数字化工具分析为两部分:数据工具和算法工具。
①、数据工具(如数据库):从数据角度出发,整合企业的主数据、交易数据、分析数据和元数据,为数据应用提供数据基础。
②、算法工具(如机器学习算法):是EDIT数字化模型的发动机,服务于价值经营、客群运营、全面质量管理、全面风险管理等各个方面。
1.3、数据分析师概述
数据分析师角色分类,可以从工作内容的角度和知识层级的角度进行分类。(此部分考的内容较少,不详细描述。)
1.3.1、数据分析师的不同角色与职责
1)从工作内容的角度划分职责:可以分为纯数据相关类岗位、数据赋能类岗位。如下图所示:
2)从知识层级角度划分职责:可分为业务数据分析师、建模算法分析师、数据科学家
1.3.2、数据分析师职业道德和行为准则
该部分大家只需要具有一定的职业和生活常识,就能答对题,不做过多讲解。
1.4、数据相关的安全与立法
1.4.1、各国的数据隐私相关法律
1)欧盟的《通用数据保护条例》(GDPR)已经于2018年5月25日正式实施。GDPR影响是全球性的,他已经成为公认的个人信息保护立法的典范,公认的最完善、最严格的隐私保护规定。
1.4.2、我国大数据立法的历程和展望
我国大数据立法历程如下:
- 2000年9月25日《互联网信息服务管理办法》
- 2003年6月28日《中华人民共和国居民身份证法》
- 2005年6月16日《个人信用信息基础数据库管理暂行办法》
- 2009年2月28日《中华人民共和国刑法修正案(七)》增加了“出售或非法提供公民个人信息罪”和“非法获取公民个人信息罪”
- 2009年12月26日《中华人民共和国侵权责任法》
- 2012年12月28日《全国人民代表大会常务委员会关于加强网络信息保护的决定》
- 2013年10月25日《中华人民共和国消费者权益保护法(2013修正)》明确规定个人信息依法得到保护等
- 2015年8月29日《中华人民共和国刑法修正案(九)》扩大个人信息受保护范围
- 2016年11月7日《中华人民共和国网络安全法》
- 2018年8月31日《中华人民共和国电子商务法》
- 2021年6月10日《中华人民共和国数据安全法》
1.5、练习题
1、单选题
-
EDIT数字化模型是企业实现数字化工作的落地模板,以下关于EDIT数字化模型描述错误的是()。
A.E指的是 Exploration(探索)
B.D指的是Data(数据)
C.I指的是Instruction(指导)
D.T指的是Tool(工具) -
2.数据分析由许多关键的阶段性步骤构成,以下不属于数据分析步骤的是()。
A.业务理解
B.数据获取
C.数据处理
D.制订决策方案 -
3.数据分析师是一个科学严谨的岗位,对从业人员专业性的要求非常高,以下行为中不能体现数据分析师专业性的是()。
A.在分析成果完整交付后不断改进算法
B.在充分了解业务需求后展开分析任务
C.不断选代数据模型,优化分析结果
D.只提供对业务结论有利的数据信息 -
4.数据安全是从事数据分析工作人员必须严格保障的事项,以下对保护
数据信息安全不利的错误做法是()。
A.将机密数据U盘随身携带
B.对机密数据载体进行加密保存
C.不在咖啡厅等公共场所使用机密数据计算机办公
D.不使用能够连入外网的计算机处理企业机密数据
2、多选题
EDIT数字化模型以知识型业务人员的常规工作为场景,展现业务流程化、数据场景化、算法工具化、决策智能化。以下关于EDIT数字化模型描述正确的是()。
A.E指的是Exploration(探索)
B.D指的是Data(数据)
C.E指的是Experience(经验)
D.D指的是Diagnosis(诊断)
3、简答题
请以数据分析师的行为准则为基础,简要描述如何专业、审慎、高效地完成数据分析业务。