根据Quora上的回答
第一步:掌握基本理论知识 + 编程
数学、算法和数据库知识
统计学知识
编程知识(如:Python)
第二步:学会获取和清理数据
DFS &Databases知识
数据传输知识
第三步:学会过滤和挖掘数据
学习用Python/R进行数据分析
学习DataMining & Machine Learning知识
第四步:学会呈现和细化数据报告
学习用工具进行DataVisualization (如:Tableau、R)
目前处于第一步:
1、Week1:读完《简明Python教程》,适应Python开发环境
2、Week2:写个爬虫,需要深入了解re、urllib2、sqlite3、threading,Queue等几个模块。需要用上多线程抓取,正则表达式分析,并发资源控制,重新开启程序自动继续抓取和分析
3、Week3:学习一种Web开发框架,推荐Flask、webpy之类的,学个数据库接口如sqlite3,写个简单的web应用如博客
4、Week4:给产品做个小功能并走完测试和上线流程,各个时期是不同的
要在8月前完成!