《数据分析师养成宝典》
第0章
写在前面的话
0.1 大数据分析案例
裸数据->业务数据化->指标设计->数据建模->分析报告
Eg:全国官员信息表和官员社会关系表(裸数据),再对他们的行为进行监控(业务数据化),如可以监控官员及其社会关系的存取款、信用卡消费、股票基金、信托投资、出入境记录(指标设计)等,并建立分析系统(建立模型),从而发现官员贪腐的蛛丝马迹(分析报告)。
数据分析指的是将数据转化为价值的一个完整过程。(定义:数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程)
数据分析与统计分析:数据分析(统计加机器学习)获得数据的价值,执行完后还需用数据监测是否达到既定目标,达到的话关键因素是什么,若未达到,问题出在哪;统计分析(纯统计)获得数据的信息,做完即结束,没有反馈。
数据分析与数据挖掘:数据挖掘是指从大量不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、有用的信息和知识的过程。挖掘的结果是数据分析报告的素材。
数据分析是一种系统化分析问题的方式,商业智能则是一种产品/服务。
数据分析的内容:描述性分析、优化业务和战略规划。
PV:page view页面浏览量
UV:unique visitor 访问页面的不同IP地址人数。
数据分析师需要对参与的项目承担进度、质量和成本的控制。
数据分析的过程:业务理解->指标设计->数据建模->分析报告
数据分析的最关键一步是特征工程,决定着数据的价值。
数据分析的第一步不是分析数据,而是梳理业务目标(Y和X是否定义清晰)。
第1章
正确的思维观(将数据转化为价值的能力)
1.1
数据思维
CEO:首席执行官
CFO:首席财务官
BD:商务拓展
数据分析思维的两个方面:分析问题的思想和处理问题时的态度。
1.2
统计思维
1.2.1
统计学