CDA LEVEL 3:备考攻略
CDA LEVEL III 考试大纲
CERTIFIED DATA ANALYST LEVEL III EXAMINATION OUTLINE
一、总体目标
CDA(Certified Data Analyst),即“CDA 数据分析师”,是在数字经济大背景和人工
智能时代趋势下,面向全行业的专业权威国际资格认证,旨在提升全球用户数字技能,助力
企业数字化转型,推动行业数字化发展。「CDA 人才考核标准」是面向全行业数据相关岗
位的一套科学化、专业化、国际化的人才技能准则,CDA 考试大纲规定并明确了数据分析
师认证考试的具体范围、内容和知识点,考生可按照大纲要求进行相关知识的学习,获取技
能,成为专业人才。
二、考试形式与试卷结构
考试方式:一年四届 (3、6、9、12 月的最后一个周六),线下统考,上机答题。
考试题型:客观选择题(单选 60 题+多选 30 题+内容相关 10 题)
案例实操题(1 题)
考试时间:90 分钟(客观选择题),120 分钟(案例实操题),共 210 分钟
考试成绩:分为 A、B、C、D 四个层次,A、B、C 为通过考试,D 为不通过
考试要求:客观选择题为闭卷上机答题,请勿携带与考试无关的用品。案例实操
题考生须自行携带电脑操作(安装好带有数据挖掘功能的软件,如:PYTHON
(推荐)、SQL、SPSS MODELER、R、SAS 等,电脑须具备 USB 拷贝功能及
相关解压软件,进行案例操作分析。案例数据将统一提供 CSV 文件)。
三、知识要求
针对不同知识,掌握程度的要求分为【领会】、【熟知】、【应用】三个级别,考生应
按照不同知识要求进行学习。
1. 领会:考生能够了解规定的知识点,并能够了解规定知识点的内涵与外延,了解其
内容要点之间的区别与联系,并能做出正确的阐述、解释和说明。
2. 熟知:考生须掌握知识的要点,并能够正确理解和记忆相关理论方法,能够根据不
同要求,做出逻辑严密的解释、说明和阐述。此部分为考试的重点部分。
第 1页,共 17页
版权所有,侵权必究
CDA LEVEL III 考试大纲
第 2页,共 17页 版权所有,侵权必究
3. 应用:考生须学会将知识点落地实践,并能够使用数据挖掘工具(如Python等)进行
实操。能够根据具体要求,给出问题的具体实施流程和策略。
◆ PART 1 数据挖掘概论(占比 10%)
a. 数据挖掘概要(2%)
b. 数据挖掘方法论(2%)
c. 基础数据挖掘技术(3%)
d. 进阶数据挖掘技术(3%)
◆ PART 2 高级数据处理与特征工程(占比 15%)
a. 高级数据处理(3%)
b. 特征工程概要(1%)
c. 特征建构(2%)
d. 特征选择(3%)
e. 特征转换(3%)
f. 特征学习(3%)
◆ PART 3 自然语言处理与文本分析(占比 10%)
a. 自然语言处理概要(占比 1%)
b. 分词与词性标注(占比 2%)
c. 文本挖掘概要(占比 1%)
d. 关键词提取(占比 2%)
e. 文本非结构数据转结构(占比 4%)
◆ PART 4 机器学习算法(占比 30%)
a. 正则化的回归模型(2%)
b. 决策树(分类树及回归树)(5%)
c. 支持向量机(1%)
d. 集成方法(9%)
e. 聚类分析(4%)
f. 关联规则(3%)
g. 序列模式(1%)
h. 模型评估(5%)
四、考试科目
CDA LEVEL III 考试大纲
第 3页,共 17页 版权所有,侵权必究
五、科目内容
◆ PART 5 数据挖掘实战(占比 10%)
a. Pipeline(2%)
b. 类别不平衡问题(4%)
c. 模型优化与调参(4%)
◆ PART 6 深度学习算法(占比 13%)
a. 感知机(1%)
b. BP 神经网络(3%)
c. 卷积神经网络(Convolutional Neural Networks, CNN)(2%)
d. 循环神经网络(Recurrent Neural Networks, RNN)(2%)
e. 优化算法(2%)
f. 深度学习中的正则化(2%)
g. 自编码器与表示学习(1%)
◆ PART 7 大语言模型与人工智能(NLP)(占比 12%)
a. 注意力机制与Transformer(3%)
b. 大语言模型及其应用(5%)
c. 微调与知识学习(3%)
d. Agent(1%)
PART 1 数据挖掘概论
◆ 1、数据挖掘概要
【领会】
数