机器学习面试常考点

最新推荐文章于 2022-10-25 15:53:31 发布

Diana003

最新推荐文章于 2022-10-25 15:53:31 发布

阅读量309

点赞数

分类专栏：面试经验分享文章标签：机器学习面试人工智能

本文链接：https://blog.csdn.net/diana003/article/details/122636689

版权

面试经验分享专栏收录该内容

1 篇文章 0 订阅

订阅专栏

各类激活函数的比较
召回率、准确率、精确率
训练误差和测试误差
过拟合和欠拟合
用来划分样本的方法
算法是否需要调参
算法是否需要迭代
算法是否需要归一化处理
逻辑斯蒂回归和线性回归的区别
生成模型和判别模型
参数模型和非参数模型
线性分类器和非线性分类器
解决类别不平衡问题
异常点敏感度
各算法对应的损失函数

各类激活函数的比较

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iY1E6kGS-1642830845125)(/assets/img/post_img/6.png)]

取值范围：(0,1),(-1,1),[0,inf]

能根据输出的值判断使用的激活函数

对数几率回归（logistics regression）和一般回归分析有什么区别？：
A. 对数几率回归是设计用来预测事件可能性的
B. 对数几率回归可以用来度量模型拟合程度
C. 对数几率回归可以用来估计回归系数
D. 以上所有
答案：D

召回率、准确率、精确率

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lReO0SSI-1642830845137)(/assets/img/post_img/7.png)]

准确率(Accuracy)

准确率(accuracy) = 预测对的/所有 = (TP+TN)/(TP+FN+FP+TN)

缺点：结果偏向样本数量大的样本，不适用于糖尿病等疾病的监测（由于正常人占比远远大于患糖尿病等疾病的人，因此当模型的准确率很高的时候，并不能相信该模型是优秀的，因为这高准确率主要由TN来决定来，但在这种情况下，我们更关注TP尽可能大）

精确率(Precision)

精确率(precision) = TP/(TP+FP)

缺点：只关心正样本的准确率

召回率(Recall)

召回率(recall) = TP/(TP+FN)

适用于“犯罪监测”，此时关心被误判数量仅可能小，也就是FN尽可能小，TP尽可能大

假设我们要解决一个二类分类问题, 我们已经建立好了模型, 输出是0或1, 初始时设阈值为0.5, 超过0.5概率估计, 就判别为1, 否则就判别为0 ; 如果我们现在用另一个大于0.5的阈值, 那么现在关于模型说法, 正确的是 :
A. 模型分类的召回率会降低或不变
B. 模型分类的召回率会升高
C. 模型分类准确率会升高或不变
D. 模型分类准确率会降低
答案: AC

the true positive rate will stay the same if we keep increasing the cutoff from 0.5 to 0.75, since the all real positive samples can still be predicted to the positive samples, and the true positive rate only rely on the number of real positive sample.

训练误差和测试误差

随着训练样本的增多，平均训练误差会逐渐增大，平均测试误差会逐渐减小。由于训练数据增多，使得原先拟合模型效果变差，因此训练误差变差，但随着训练数据的增多，最终使得整体拟合效果更好，则测试误差会越小，因此训练误差和测试误差之间的差距就会减小。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YJRA8apM-1642830845139)(/assets/img/post_img/8.png)]

过拟合和欠拟合

过拟合

在训练集上的表现好，但在测试集上的表现能力差。
模型偏差为0，方差大
泛化能力差

欠拟合

对训练样本的一般性质尚未学好
模型偏差大，方差为0

产生过拟合的原因

模型过于复杂
- 特征过多
- 神经元过多
- 核函数选择的过于复杂
训练数据量太少

产生欠拟合的原因

模型过于简单
训练数据量过多

过拟合的解决办法

增加数据量
降低模型的复杂度
添加正则化项
如果有正则项，则适当增大正则化系数
集成学习的方法
特征降维
交叉验证

欠拟合的解决办法

添加新特征，如在决策树学习中扩展分支，在神经网络学习中增加训练次数
增加模型的复杂度，尝试使用核SVM，DNN，决策树
如果有正则项，减少正则化系数

用来划分样本的方法

随机设置比例
交叉验证
自助采样：适用于数据集较小，集成学习
留出法

算法是否需要调参

需要进行调参的算法

神经网络
SVM
岭回归
LASSO
加权线性回归
LR
K-Means
AdaBoost
GMM

不需要进行调参的算法

决策树
LDA
NB
线性回归

算法是否需要迭代

需要经过多次迭代的算法

LR
决策树
神经网络
聚类
AdaBoost
SVM

不需要经过多次迭代的算法

LDA
线性回归
NB

算法是否需要归一化处理

需要进行归一化的算法

需要进行梯度下降操作的算法

因为当不归一化的时候可能在梯度下降法寻求最优解时，收敛速度很慢迭代次数很多。

e.g.LR，SVM，AdaBoosting,神经网络

需要进行计算距离的算法

因为如果其中一个特征值域范围很大，那么在进行距离计算的时候就主要取决于这一个特征而忽视其他特征。

e.g.KNN，K-Means，LDA

不需要进行归一化的算法

树形结构的算法

由于树形结构寻找最优解的时候采用的不是梯度下降（因为树形结构模型是分段的一般不可导），而是通过寻找最优分裂点

e.g.决策树，随机森林，XGBoost,Boosting Tree，GBDT

概率模型

高斯混合模型(GMM)，朴素贝叶斯，LR

逻辑斯蒂回归和线性回归的区别

①逻辑斯蒂回归解决的是分类问题，而线性回归解决的则是预测问题。逻辑斯蒂回归将实例x划分到条件概率最大的那一类。
②逻辑斯蒂回归的因变量是离散的，而线性回归得因变量是连续的，逻辑斯蒂回归可以看成是对数几率的线性回归。
③逻辑斯蒂回归参数求解的过程中，使用到了极大似然估计而线性回归则使用最小二乘法。二者在求解时均用到了梯度下降的方法。