1.必备武器--SQL
1)SQL基础语法,包括语句查询、过滤条件、多表组合等
2)数据库表的增、删、查、改,这是SQL最基础,也是最核心的知识3)数据聚合计算,包括分组计算、自定义函数计算等
参考书籍:《SQL必知必会》
参考网站:http://www.runoob.com/sql/sql-tutorial.html2.数据挖掘核心武器-PYTHON
1)python基础语法,重点要学习数据结构、函数定义、类定义等
2)pandas库进行数据管理、清洗、转换等3)numpy等高级库进行数值计算、线性转换等
4)能够灵活使用第三方库sklearn、gensim等进行机器学习建模参考书籍:《learn python the hard way》、《利用python进行数据分析》
参考网站:https://learnpythonthehardway.org/python3/3.统计学与概率论
1)统计学基础知识,包括方差、中位数、协方差等定义
2)理解并掌握离散分布与连续分布,比如高斯分布、泊松分布等概念。做到深刻理解,能够写出公式且熟知运用
3)了解统计假设检验
参考书籍:《商务经济与统计》、《深入浅出统计学》4.数据挖掘理论及应用
1)了解并掌握数据挖掘基础知识,包括代价函数、过拟合、泛化能力等
2)区分监督学习、无监督学习、半监督学习、同时要区分回归与分类模型等常用知识的区别3)对于常用模型要有深刻