机器学习面试节选

最新推荐文章于 2022-11-17 19:56:32 发布

Eric_zh69

最新推荐文章于 2022-11-17 19:56:32 发布

阅读量628

点赞数

分类专栏：机器学习面试

本文链接：https://blog.csdn.net/shaiguchun9503/article/details/82928547

版权

本文摘录了机器学习面试的部分重点，涉及随机森林处理缺失值、特征重要性评估、KMeans优化策略、对偶问题理解、特征选择方法以及激活函数与XGBoost的相关知识点。同时探讨了判别式模型与生成式模型的区别，以及HMM中的参数估计方法。

摘要由CSDN通过智能技术生成

96.你有哪些deep learning（rnn、cnn）调参的经验？
参考https://www.zhihu.com/question/41631631

111.随机森林如何处理缺失值 方法一（na.roughfix）简单粗暴，对于训练集,同一个class下的数据，如果是分类变量缺失，用众数补上，如果是连续型变量缺失，用中位数补。
方法二（rfImpute）这个方法计算量大，至于比方法一好坏？不好判断。先用na.roughfix补上缺失值，然后构建森林并计算proximity matrix，再回头看缺失值，如果是分类变量，则用没有阵进行加权平均的方法补缺失值。然后迭代4-6次，这个补缺失值的思想和KNN有些类似1缺失的观测实例的proximity中的权重进行投票。如果是连续型变量，则用proximity矩2。

112.随机森林如何评估特征重要性 衡量变量重要性的方法有两种，Decrease GINI 和 Decrease Accuracy：
1) Decrease GINI：对于回归问题，直接使用argmax(VarVarLeftVarRight)作为评判标准，即当前节点训练集的方差Var减去左节点的方差VarLeft和右节点的方差VarRight。
2) Decrease Accuracy：对于一棵树Tb(x)，我们用OOB样本可以得到测试误差1；然后随机改变OOB样本的第j列：保持其他列不变，对第j列进行随

最低0.47元/天解锁文章

Eric_zh69

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习面试节选

96.你有哪些deep learning（rnn、cnn）调参的经验？参考https://www.zhihu.com/question/41631631111.随机森林如何处理缺失值方法一（na.roughfix）简单粗暴，对于训练集,同一个class下的数据，如果是分类变量缺失，用众数补上，如果是连续型变量缺失，用中位数补。方法二（rfImpute）这个方法计算量大，至于比方法一好坏？...
复制链接

扫一扫

专栏目录