markdown
数据分析全景图
学习一门知识,应该尽可能从多个角度对其进行认识。
数据分析的组成
数据分析由三个部分组成:
- 数据采集
- 数据挖掘: **数据分析中商业价值的所在。数据挖掘的核心是挖掘数据的商业价值,即人们常谈的商业智能 BI**
- 数据可视化
三个组成部分的图片展示:
- 数据采集
- 数据挖掘
需要掌握常用的十大算法,这十大算法可以分为四类:
类别 | 具体算法名 |
---|---|
分类算法 | 决策树(ID3、C4.5、CART)朴素贝叶斯、 SVM、KNN、Adaboost |
聚类算法 | K-Means, EM |
关联分析 | Apriori |
连接分析 | PageRank |
- 数据可视化
常用的数据可视化方法:
第一种:使用Python, eg: Matplotlib, Seaborn
第二种:使用第三方工具,已经生成了csv格式文件,想要采用所见即所得的方式进行呈现,可以采用微图、DataV、Data GIF Maker等第三方工具。
数据采集和数据可视化的原理简单,重点是在工具的掌握。通过实操练习来进行掌握。
经验者说: 学习数据分析最好的方法是:在工具中灵活运用,在项目中加深理解。