面试Python机器学习时,常见的十个面试题

本文整理了Python机器学习面试中常见的十个问题,包括有监督学习与无监督学习的区别、正则化、生成模型与判别模型、线性分类器与非线性分类器的对比、特征比数据量大时的选择、归一化的作用、随机森林处理缺失值的方法以及特征选择策略等。这些问题涵盖了机器学习的基础和核心概念,对面试者具有重要参考价值。
摘要由CSDN通过智能技术生成

小千整理了一下往期同学再面试Python机器学习工作的时候常见的十个面试题,并且附上了详细解答,供同学们参考,面试前看一看,说不准就用得上呢?
在这里插入图片描述

1.有监督学习和无监督学习有什么区别?

有监督学习:对具有标记的训练样本进行学习,以尽可能对训练样本集外的数据进行分类预测。(LR,SVM,BP,RF,GBDT)

无监督学习:对未标记的样本进行训练学习,比发现这些样本中的结构知识。(KMeans,DL)

2.什么是正则化?

正则化是针对过拟合而提出的,以为在求解模型最优的是一般优化最小的经验风险,现在在该经验风险上加入模型复杂度这一项(正则化项是模型参数向量的范数),并使用一个rate比率来权衡模型复杂度与以往经验风险的权重,如果模型复杂度越高,结构化的经验风险会越大,现在的目标就变为了结构经验风险的最优化,可以防止模型训练过度复杂,有效的降低过拟合的风险。

奥卡姆剃刀原理,能够很好的解释已知数据并且十分简单才是最好的模型。

3.什么是生成模型和判别模型?

生成模型:由数据学习联合概率分布P(X,Y),然后求出条件概率分布P(Y|X)作为预测的模型,即生成模型:P(Y|X)= P(X,Y)/ P(X)。(朴素贝叶斯、Kmeans)

生成模型可

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值