面试Python机器学习时，常见的十个面试题

最新推荐文章于 2022-09-23 14:40:11 发布

程序员的小傲娇

最新推荐文章于 2022-09-23 14:40:11 发布

阅读量809

点赞数

分类专栏： Python 文章标签：机器学习人工智能深度学习算法 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaoxijinger/article/details/117067532

版权

本文整理了Python机器学习面试中常见的十个问题，包括有监督学习与无监督学习的区别、正则化、生成模型与判别模型、线性分类器与非线性分类器的对比、特征比数据量大时的选择、归一化的作用、随机森林处理缺失值的方法以及特征选择策略等。这些问题涵盖了机器学习的基础和核心概念，对面试者具有重要参考价值。

摘要由CSDN通过智能技术生成

小千整理了一下往期同学再面试Python机器学习工作的时候常见的十个面试题，并且附上了详细解答，供同学们参考，面试前看一看，说不准就用得上呢？
在这里插入图片描述

1.有监督学习和无监督学习有什么区别？

有监督学习：对具有标记的训练样本进行学习，以尽可能对训练样本集外的数据进行分类预测。（LR,SVM,BP,RF,GBDT）

无监督学习：对未标记的样本进行训练学习，比发现这些样本中的结构知识。(KMeans,DL)

2.什么是正则化？

正则化是针对过拟合而提出的，以为在求解模型最优的是一般优化最小的经验风险，现在在该经验风险上加入模型复杂度这一项（正则化项是模型参数向量的范数），并使用一个rate比率来权衡模型复杂度与以往经验风险的权重，如果模型复杂度越高，结构化的经验风险会越大，现在的目标就变为了结构经验风险的最优化，可以防止模型训练过度复杂，有效的降低过拟合的风险。

奥卡姆剃刀原理，能够很好的解释已知数据并且十分简单才是最好的模型。

3.什么是生成模型和判别模型？

生成模型：由数据学习联合概率分布P(X,Y)，然后求出条件概率分布P(Y|X)作为预测的模型，即生成模型：P(Y|X)= P(X,Y)/ P(X)。（朴素贝叶斯、Kmeans）

生成模型可

最低0.47元/天解锁文章

程序员的小傲娇

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。