最近在学数据分析,这期间,看了不少书,也敲了很多代码,对数据分析有了比较深入的了解。想写点东西,和大家一起分享。
- 编程语言
1.Python
2.R
3.Matlab
数据分析首推R和Python,这点大家已经达成了共识。为什么要把Matlab放这里面的?因为,Matlab是我数学系的一大神器,积分,微分,解微分方程,画图都很方便。Matlab还是很强大的,我觉得,如果它不是商业软件,是有机会和R一争高下的。
再说回R和Python,在学数据分析的时候,总会有人纠结,是用R好呢,还是用Python好呢?语言只是工具,结果才是王道。就算是用C语言,只要能做出结果,那也没有任何问题。我的建议是,如果以前有过编程经验,学过C/C++,Java,Python等编程语言,就用python。如果没有任何编程经验,那用R。 - 学习路线
选择一门语言后。就该考虑学习路线的问题了。我选择的语言是python,所以,以python为例,谈谈我的建议。首先是python入门。python是一门很强大的编程语言,在很多方面都有这广泛的用途,比如:网络爬虫,网站开发,web后端,数据分析,数据挖掘,机器学习等。我们这里只谈数据分析,数据挖掘和机器学习可以作为数据分析的后续内容。
python入门推荐廖雪峰的python教程,里面的内容不用全部看,只学我们需要的即可,具体内容后面会给出。
然后就是python的数据分析包了,numpy,pandas,scipy,matplotlib,sk-learn,如果想往深度学习方向走,还可以学习keras, tensorflow, caffe。
学习完之后就可以自己去做项目了,在项目中感受下这些东西到底怎么用。如果项目不好找ÿ