1.什么是数据分析:
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细介绍和概括总结的过程。数据分析的目的有很多种,总的来说有三种:现状分析、原因分析和预测分析。现状分析简单来说就是告诉你过去发生了什么;原因分析就是告诉你发生这一现状的原因;预测分析就是预测未来会发生什么。
2. 数据分析步骤:
数据分析主要有六个过程:
(1)明确需求:明确数据分析的目标,为后面的分析过程做铺垫;
(2)数据收集:通过各种方式获取需要的数据;
(3)数据处理:对获取来的数据进行处理和清洗,把不需要的剔除掉,把需要的数据加工成我们想要的样子,方便后面的处理;
(4)数据分析:根据自己的目的以及现有的数据,确定数据分析的方法;
(5)数据展示:将数据按照确定好的分析方法进行展示;
(6)撰写报告:将分析的结果通过图表和文字的方法形成报告文档。
3.数据分析的方法和工具
数据分析可以通过工具,也可以通过代码来实现,分别列出以下常用的:
(1)工具:Excel、Tableau、SPSS和百度图说等;
(2)编程:Python、R语言、数据库SQL和Excel的VBA语言等;
4.工具和代码该怎么选:
工具和代码没有好坏之分,只有合适之分。数据分析总的来说有两个模块,一个是数据处理,一个是数据可视化。如果数据已经处理过,并且手头上的软件可以直接方便地做可视化处理,那么我们用软件实现就可以。如果数据没有经过处理,那么最好通过Python语言进行一些处理,然后再通过软件进行可视化;或者软件的可视化无法满足我们的要求,那么可以通过代码进行处理。总而言之,工具无法满足所有的要求,但是效率比较高;代码做数据处理比较好,但是比较繁琐,DIY属性比较强。