一、数据分析概念、方法论、角色(占比1%)
1、数据分析基本概念(数据分析、数据挖掘、大数据)
数据分析 Data Analysis
是以数据为分析对象,以探索数据内的有用信息为主要途径,以解决业务需求为最终目标,
包含业务理解、数据采集、数据清洗、数据探索、数据可视化、数据建模、模型结果可视化、分析结果的业务应用等步骤在内的一整套分析流程。
数据挖掘 Data Mining
通常也被称为数据知识发现(KDD Knowledge Discovery in Database),是自动或方便地提取模式,表示在大型数据库,数据仓库,Web,其他海量信息库或数据流中隐式存储或捕获的知识。
数字化的工作 EDIT
EDIT是指数字化工作模型,以知识型业务人员的常规工作为场景,展现业务流程化、数据场景化、算法工具化、决策智能化
业务运行探索(E):各项业务的运行状态(工厂的仪表盘)
问题根因诊断(D):数据的定向与定性结合,定位和分析问题
业务策略指导(I):制定业务策略指导,定制优化策略
智能算法工具(T):上述工作均涉及到算法的应用
2、数据分析目的及其意义
数据分析本质(现状、归因、预测)
数据分析(Data Analysis):解决业务需求为最终目标
数据挖掘(Data Mnining):利用较大型数据采集,集中发现模型
可以认为数据分析涉及到公司运营的方方面面,
这包括对企业部门经营情况的评估、内部员工的管理、生产流程的监管、产品结构优化与新产品开发、财务成本优化、市场结构的分析和客户关系的管理。
其中,关于客户与市场的数据分析是“重头戏”。
数据分析的目的
数据分析的目的:发现有价值的信息、提出结论、为业务发展提供辅助决策。
它描述了”过去发生了什么“、”现在正在发生什么“和“未来可能发生什么”。
意义/作用
现状分析
归因分析
预测分析
3、数据分析方法与流程
业务描述性分析流程
a、业务理解
是业务描述性分析的起点,也是流程中最为重要的步骤。要求分析人员能够全面、准确地理解业务问题及业务需求,并结合业务需求制定完整的分析计划。
b、数据获取
基于业务分析需求从多渠道获取分析数据的步骤,数据获取阶段的主要任务是能够全面地获取与业务需求相关的所有据。
在业务描述性分析中使用到的数据以结构数据为主,会在后边章节中为大家进行展开说明。数据获取阶段得到的数据没有质量保证,不能直接用来进行分析,在业务描述性分析中将直接获取到的数据称为“原始数据”。
c、数据处理
将原始数据进行清洗、加工,从而得到高质量的可用来进行分析的有效数据的过程。
d、数据分析
针对处理过后的有效数据进行业务描述性分析的方法。
e、结果展现
将分析结里以业冬分析报告或是可视化分析报表(仪表盘、商业智能报表)的形式呈现给业务决策者的步骤。在结果展现环节要求内容要准确、客观、全面、直观、易懂。
CRISP–DM 方法论(数据挖掘 流程)
CRISP-DM (cross-industry standard process for data mining),
即为"跨行业数据挖掘标准流程"
该模型将一个KDD工程分为6个不同的阶段:
SEMMA 模型(数据挖掘 流程)
由SAS研究院开发的一款非常著名的数据挖掘与分析方法
对CRISP–DM 方法重的数据准备和建模环节进行了拓展
4、数据分析的不同角色与职责
二、数据分析师职业道德与行为准则(占比1%)
1、数据分析师职业道德操守
对于数据产权,用户的利益和机构的利益置于个人利益之上
保护数据资产的安全性、真实性、可靠性(要说明使用了什么科学的方法)
不参与任何违法行为;不适用或滥用他人产权;不宽恕或帮助他人违法
2、数据分析师专业行为准则
应全面了解业务背景、痛点、需求。获取符合要求的源数据。
根据业务需要,选择合理的工具、平台、系统及算法。
不断迭代并优化业务指标与数据模型
做出具有商业价值的建议,并使其可视化
按时按质完整交付,并对相关数据和代码保密
履行后期义务和责任,给出指导意见