1.大概学习路径图
2.数学基础
2.1 微积分:
知识:微积分的计算及物理意义,凸优化和条件最优化
运用:梯度下降法、牛顿法等。能理解“梯度下降是用平面来逼近局部,牛顿法是用曲面逼近局部”.
2.2 线性代数
知识:矩阵乘法,向量的内积运算
运用:矩阵乘法与分解主要运用在主成分分析(PCA)和奇异值分解(SVD)
2.3 概率与统计
知识:极大似然思想,贝叶斯模型,高斯分布
运用:朴素贝叶斯(Naïve Bayes )、语言模型(N-gram)、隐马尔科夫(HMM)、隐变量混合概率模型、混合高斯模型(GMM)
3 编程基础---python
主要学习以下几个包的运用:
pandas:进行数据浏览和预处理
numpy:数组计算
scipy:高效的科学计算
matplotlib:数据可视化工具
4 机器学习常用的方法
片段引用自 http://blog.csdn.net/han_xiaoyang/article/details/50759472
- 处理分类问题的常用算法包括:逻辑回归(工业界最常用),支持向量机,随机森林,朴素贝叶斯(NLP中常用),深度神经网络(视频、图片、语音等多媒体数据中使用)。
- 处理回归问题的常用算法包括:线性回归,普通最小二乘回归(Ordinary Least Squares Regression),逐步回归(Stepwise Regression),多元自适应回归样条(Multivariate Adaptive Regression Splines)
- 处理聚类问题的常用算法包括:K均值(K-means),基于密度聚类,LDA等等。
- 降维的常用算法包括:主成分分析(PCA),奇异值分解(SVD) 等。
- 推荐系统的常用算法:协同过滤算法
- 模型融合(model ensemble)和提升(boosting)的算法包括:bagging,adaboost,GBDT,GBRT
- 其他很重要的算法包括:EM算法等等。