PART 1 数据分析概念与职业操守
1、数据分析概念、方法论、角色(占比 1%)
【领会】
数据分析基本概念(数据分析、数据挖掘、大数据) 数据分析目的及其意义
数据分析(Data Analysis):是以数据为分析对象,以探索数据内的有⽤信息为主要途径,以解决业
务需求为最终⽬标,包含业务理解、数据采集、数据清洗、数据探索、数据可视化、数据建模、模型结
果可视化、分析结果的业务应⽤等步骤在内的⼀整套分析流程。
数据挖掘(Data Mining) : 是⼀个跨学科的计算机科学分⽀,它是⽤⼈⼯智能、机器学习、统计学和数
据库的交叉⽅法在相对较⼤型的数据集中发现模式的计算过程。
数据分析的⽬的:发现有价值的信息、提出结论、为业务发展提供辅助决策。它描述了 ”过去发⽣了什
么“、”现在正在发⽣什么“ 和 “未来可能发⽣什么”。根据分析层次的级别不同,分为常规报表、即席查
询、多维分析(⼜称钻取或OLAP)、警报、统计分析、预报(或者时间序列预测)、预测型建模
(Predictive Model)和优化。
数据分析方法与流程
CRISP-DM方法论:
业务理解、数据理解、数据准备、建模、模型评估、模型发布
SEMMA方法论:
AB测试:
EDIT模型:E:Exploration探索;D:Diagnosis 诊断;I:Instruction指导;T:Tool工具
数据分析的不同角色与职责
2、数据分析师职业道德与行为准则(占比 1%)
【领会】
数据分析师职业道德操守数据分析师专业行为准则
3、大数据立法、安全、隐私(占比 1%)
【领会】
国外隐私相关法律要求(参阅《国际数据保护规则要览》)
国内大数据立法的历程和展望(参阅《中国大数据法治发展报告》)
欧盟《通用数据保护条例》(General Data Protection Regulation,简称 GDPR)中企业和个人的数据使用权限