1.数据分析:
为了提取有用信息和形成结论而对数据加以详细研 究和概括总结的过程。
2.数据分析的作用:
现状分析,原因分析,预测分析。
3.数据分析六部曲:
明确分析目的和思路——>数据收集——>数据处理——>数据分析——>数据展现——>报告撰写。
4.数据分析师的职业要求:
懂业务、懂管理、懂分析、懂工具、懂设计。
5.数据分析师基本素质:
态度严谨负责、好奇心强列、逻辑思维清晰、擅长模仿学习、勇于创新。
6.数据分析基本流程:CRISP–DM方法论:知识发现,数据挖掘(KDD工程完整过程描述)
商业理解——>数据理解——>数据准备——>模型建立——>模型评估——>上线发布。
7.(1)商业智能BI
基于数据仓库,经数据挖掘,得到商业价值。
(2)数据仓库DW
BI基地,数据库的升级概念,由多个数据来源中的数据汇总而成。
(3)数据挖掘
在相对较大型的数据集中发现模式的计算过程。包括分类、聚类、预测、关联分析等。
(4)数据仓库是金矿,数据挖掘是炼金术,商业报告是黄金。
8.数据分析不同角色与职责
角色 | 职责 |
---|---|
项目领导者 | 项目规划 |
数据构建者 | 数据模型,查询语言 |
产品开发者 | 实现跟踪 |
分析者 | 提供新的业务问题 |
报告制作者 | 为业务提供报告 |
9.我国大数据立法的方向和建议
1)个人数据保护
2)跨境数据流动
3)数据交易规则
4)政府数据开发
10.欧盟GDPR(《通用数据保护条例》)
11.SEMMA方法论
AB测试
EDIT模型:E.Exploration 探索
D.Diagnosis 诊断
I.Instruction 指导
T.Tool 工具
12.图
1)金字塔图:
每个塔层高度和其点的值有关,是特殊的倒置漏斗图。
2)矩阵图:
从多维问题中找出成对因素群,排列成行和列,找出其中行和列相关性或相关程度大小的一种方法。
3)漏斗图:(销售各阶段流失情况)
动态状态监控和分析,往往展现每个阶段数据减少情况。
4)帕累托图:(发现重要客户群体)
“二八原则”的图形化体现,又叫排列图,主次图,按照发生频率大小顺序绘制的直方图。将出现的质量问题和质量改进项目按照重要程度依次排列而采用的一种图表。
5)不同对象间的比较应使用柱形图。
6)雷达图突出对象间的差异程度。