机器学习技术点----apachecn的github地址 预处理 离散化 等值分箱等量分箱独热 one-hot标准化 最小最大 min-maxz-scorel2 标准化归一化特征选择 ANOVA信息增益/信息增益率 模型验证 评价指标 回归 MSER 方分类 准确率精确率召回率F1 得分宏平均 F1微平均 F1聚类 互信息轮廓距离交叉验证 K 折网格搜索 最优化方法 梯度下降随机梯度下降 SGD牛顿法/拟牛顿法动量法RMSPropAdam 传统机器学习 基本概念 欠拟合/过拟合距离 汉明距离曼哈顿距离欧几里得距离切比雪夫距离余弦相似度pearson 相似度损失函数 MSE交叉熵Hinge线性模型 线性回归Lasso/岭回归 正则化逻辑回归softmax 回归支持向量机 拉格朗日对偶软边界支持向量机核方法树和森林 决策树随机森林GDBT/XGBoostLightGBM集成学习 BaggingBoosting AdaboostBlending/StackingKNN聚类 KMenas层次聚类 凝聚聚类分裂聚类DBSCAN谱聚类高斯混合模型 GMM概率图 朴素贝叶斯隐马尔科夫 HMM降维 PCA/SVDT-SNE 深度学习 基本概念 正向传播反向传播激活函数 sigmoidsoftmaxtanhReLUELULeaky ReLU丢弃 Dropout微调 Fine-Tune批量归一化 BatchNorm前馈神经网络 DNN/多层感知机 MLP 输入层隐层输出层卷积神经网络 CNN 层 卷积层池化层全连接层经典结构 LeNetAlexNetZFNetGoogLeNetVGGResNetDenseNet循环神经网络 RNN 循环层经典结构 LSTMGRUBiLSTM注意力Seq2Seq自编码器 栈式自编码器稀疏自编码器去噪自编码器变分自编码器生成对抗网络 GAN DCGAN 应用领域(待扩展) 推荐系统机器视觉 CV自然语言处理 NLP生物信息 常用工具 数据分析 NumPyPandas科学计算 SciPy可视化 MatplotlibSeaborn机器学习 scikit-learn/sklearnXGBoostLightGBM深度学习 KerasTensorFlowPyTorch 分类: 机器学习