算法要求:原理、公式推导、自己实现、分布式、优缺点、使用场景、如何选型 机器学习目录(暂定) CART GBDT KKT KNN L1,L2 LR SVM libsvm和liblinear random forest bagging,adaboost,boosting,线性加权,cascade EM K-Means k-fold 交叉验证 xgboost softmax 数据归一化 优化方法(梯度下降、牛顿法、拟牛顿法,坐标下降……) 过拟合 贝叶斯估计 朴素贝叶斯 SVD,SVD++ 信息熵、薪资增益、互信息、基尼系数 CNN RNN LSTM 决策树 分类、回归模型 判别、生成模型 损失函数、目标函数、代价函数 HMM 激活函数 评估模型效果 BP算法 特征选择(互信息、卡方检验、树模型……) ML与DL区别 数据不平衡 word2vec 哈夫曼树 C4.5,ID3,CART区别 样本采样