机器学习算法工程师面试集锦（更新中）

最新推荐文章于 2023-05-17 14:33:33 发布

一只进阶的程序媛

最新推荐文章于 2023-05-17 14:33:33 发布

阅读量3.3k

点赞数 6

分类专栏：面试与秋招机器学习

本文链接：https://blog.csdn.net/uestwm/article/details/90636329

版权

机器学习算法工程师面试集锦（更新中）

面试问题汇总
参考资料

面试问题汇总

问题来自于牛客，公众号，以及自己的亲身体验。

常用的损失函数

0-1损失函数
平方损失函数
L(Y,f(X))=(Y-f(X))^2
绝对损失函数
L(Y,f(X))=|Y-f(X)|
对数损失函数
L(Y,P(Y|X))=-log P(Y-|X)

介绍交叉验证

简单交叉验证
K折交叉验证
留一交叉验证

特征选择方法

递归特征消除RFE（网上有很多RFE资料）
基于学习模型的特征排序
去掉取值变化小的特征

机器学习项目的一般步骤

问题抽象
数据获取
特征工程（数据清洗，预处理，采样）
模型训练、调优
模型验证、误差分析
模型融合
模型上线

经验风险最小化与结构风险最小化

经验风险最小化
统计学中的极大似然估计（Maximum Likelihood Estimation MLE）就是经验风险最小化的一个典型的例子。当模型是条件概率分布，损失函数是对数损失函数时，经验风险最小化与极大似然估计等价。虽然在样本数量足够大的情况下，经验风险最小化求解出来的模型能够取得不错的预测效果，但是当训练数据集也就是样本容量比较小时，基于经验风险最小化训练出来的模型往往容易过拟合
结构风险最小化
与经验风险最小化对应的叫做结构风险最小化。结构风险最小化是为了防止过拟合而提出来的一种策略，它与正则化等价。结构风险在经验风险的基础上加上表示模型复杂度的正则化项或者罚项。其定义如下:

训练决策树时的参数是什么

class sklearn.tree.DecisionTreeClassifier(criterion=‘gini’, splitter=‘best’, max_depth=None, min_samples_split=2,min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=None, random_state=None, max_leaf_nodes=None,min_impurity_split=1e-07, class_weight=None, presort=False)
重要的参数 ：
criterion：规定了该决策树所采用的的最佳分割属性的判决方法，有两种：“gini”，“entropy”。
max_depth：限定了决策树的最大深度，对于防止过拟合非常有用。
min_samples_leaf：限定了叶子节点包含的最小样本数，这个属性对于防止数据碎片问题很有作用。
min_weight_fraction_leaf：这个值限制了叶子节点所有样本权重和的最小值，如果小于这个值，则会和兄弟节点一起被剪枝。默认是0，就是不考虑权重问题。一般来说，如果我们有较多样本有缺失值，或者分类树样本的分布类别

最低0.47元/天解锁文章

一只进阶的程序媛

关注

6
点赞
踩
36

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法工程师面试集锦（更新中）

机器学习算法工程师面试集锦（更新中）面试问题汇总训练决策树时的参数是什么在决策树的节点处分割标准是什么基尼系数的公式熵的公式是什么决策树如何决定在哪个特征处分割随机森林的优点有哪些介绍一下boostinggradient boosting如何工作关于AdaBoost算法，你了解多少？它如何工作？SVM中用到了哪些核？SVM中的优化技术有哪些？SVM如何学习超平面？用数学方法详细解释一下。介绍一下无...
复制链接

扫一扫