机器学习已经成为继理论、实验和数值计算之后的科研“第四范式”,是发现新规律,总结和分析实验结果的利器。机器学习涉及的理论和方法繁多,编程相当复杂,一直是阻碍机器学习大范围应用的主要困难之一,由此诞生了Python,R,SAS,STAT等语言辅助机器学习算法的实现。在各种语言中,R语言以编程简单,方法先进脱颖而出,本次机器学习基于现代R语言,Tidyverse,Tidymodel语法。
内容详情:
专题一:基础知识
- Tidymodel,Tidyverse语法精讲
- 机器学习的基本概念
- 机器学习建模过程
- 特征工程
专题二:回归
- 线性回归略谈
- 岭回归
- 偏最小二乘法
- Lasso回归与最小角度回归
- 弹性网回归
专题三:树形模型
- 分类回归树
- 随机森林
专题四:集成学习
- 梯度提升法
- 装袋法
- GBM与随机GBM
- XGBOST
- 总结
专题五:其它方法
- 支持向量机
- 深度学习基础
- 可解释的机器学习
专题六:降维
- 主成分分析
- 广义低秩模型
- Autoenconders
专题七:聚类与分类
- K-均值聚类
- 分层聚类
- K-近邻分类
- Logistic回归