数据分析总纲
一、定义
数据分析,即从大量、无序的数据当中获取有用的信息进而形成相应策略的方法与手段。
二、数据分析的三大原则
1.在数据分析之前,必然要对所研究的事物做详尽的调查,只有全面的了解之后,你给出的策略才会更有意义。
2.数据分析的方法追求适用,而不是复杂度。
3.在不违反前两条的情况下,数据分析要追求创新性。
三、数据分析流程
在我看来数据分析主要分为五个大部分。
数据分析理论基础—数据获取—数据清洗—数据分析模型—数据可视化与报告
如果一个数据分析从业人员能够熟练地掌握以上五大部分,那么可以说他是合格的。
1.数据分析理论基础
数据分析理论基础模块包含丰富,涉及到统计学、管理学、以及与各种行业相关的学科,基本上是一整套数据分析的思维理论与方法论。
2.数据获取
数据获取模块需要掌握各种数据库的原理和使用方法、网络爬虫的应用、市场调查与社会调查的具体方法。
3.数据清洗
数据清洗模块需要掌握各种模型的数据准备方法和数据处理方式,是整个数据分析流程中花费时间较长的一步。
4.数据分析模型
数据分析模型可以分为验证性分析和探索性分析两大部分,其中验证性分析主要是传统的描述与推断统计学,而探索性分析主要是以大数据为研究对象的新兴数据科学。验证性分析重样本、重推断、重实证,探索性分析重总体,重优化,重预测。
5.数据可视化与报告
数据分析的最终目的就是给予策略与建议,而数据可视化就成为了很重要的一步,如何将数据与结论更好地呈现在大家面前,这就是该模块的核心问题。
总而言之,数据分析不仅需要扎实的统计学知识,也需要灵敏与独特的分析思维,一份优秀的报告就是在以上五个模块融会贯通之后的成果。