机器学习基础/面试笔记
文章平均质量分 68
SpadeA_Iverxin
学无止境
展开
-
0. 写在前面
最近通读了一遍《百面机器学习》这背书,里面都已以面试问题的形式提出的,但是书籍整体脉络清晰,速读一遍后让自己对知识体系和一些问题的细节得以重新思考,收获颇丰。 第二遍精读,将随手记录笔记,写在这个系列中,并对一些内容进行进一步的详细扩充。 如果你对机器学习有一定的基础,建议读一下这本书,可能会有不一样的收获。 ...原创 2021-06-01 10:57:58 · 117 阅读 · 0 评论 -
2.机器学习复习笔记-各种评估指标
文章目录准确率(Accuracy)精确率(Precision)、召回率(Recall)、PR曲线。F1 ScoreRMSEROCPR曲线和ROC曲线对比余弦距离、欧氏距离、KL距离 准确率(Accuracy) acc=numcorrectnumall acc = \frac{num_{correct}}{num_{all}} acc=numallnumcorrect 既正确的数量除以错误的数量。 准确率这个指标的短板在于训练数据是否偏斜。以二分类为例,当正样本数量占5%,而负样本数量占95%时,即使模原创 2021-07-06 20:49:27 · 411 阅读 · 2 评论 -
1. 特征工程相关(1)
文章目录特征工程(1)1. 方法概述:2.1 数据清洗2.1.1 数据缺失值2.1.2 噪声处理2.2 归一化2.3 特征编码Reference 特征工程(1) 特征工程是机器学习中十分重要的一环,特征工程做的好坏往往对模型的效果有着直接的影响。本篇总结了一些常见的特征工程方法和适用情况,并对原理进行简要分析。 1. 方法概述: 数据清洗:主要对数据的缺失值进行填充和噪声进行处理。 归一化:统一数据范围,加快梯度下降。 特征编码:对特征进行数据化描述。 特征组合:把一些特征进行组合,从原创 2021-06-01 10:54:56 · 148 阅读 · 0 评论