1.1数据分析三个重要组成
-
数据采集。采集数据源,数据的来源。
-
数据挖掘。注重考察数据本身的关系,获得一些隐藏的结论,目标群体司不确定的,需要更多的是从数据的内在联系上去分析,这一部分也可以叫做数据分析的算法部分。数据挖掘的核心是挖掘数据的商业价值,也就是我们所谈的商业智能BI。
-
数据可视化。可以让我们直观地了解到数据分析的结果。
1.2数据采集
通常会和数据源打交道,然后使用工具进行采集。
1.3数据挖掘
要知道它的基本流程、十大算法、以及背后的数学基础。
1.4 数据可视化
有两种方法。
第一种就是使用Python。在Python对数据进行清洗、挖掘的过程中,我们可以使用Matplotlib、Seaborn等第三方库进行呈现。
第二种就是使用第三方工具。如果你已经生成了csv格式文件,想要采用所见即所得的方式进行呈现,可以采用微图、DataV、Data GIF Maker等第三方工具,它们可以很方便地对数据进行处理,还可以帮你制作呈现的效果。