机器学习面试题库:111-120题(12day)

机器学习面试题库:111-120题(12day)

在这里插入图片描述
KNN算法肯定不是线性的边界,所以直的边界就不用考虑了。另外这个算法是看周围最近的k个样本的分类用以确定分类,所以边界一定是坑坑洼洼的。
在这里插入图片描述
利群点要着重考虑, 第一点是对的,不是必须的,
当然, 如果是正态分布, 训练效果会更好,
有少量的多重线性相关性是可以的, 但是我们要尽量避免。

在这里插入图片描述
Var1和Var2相关系数是负的, 所以这是多重线性相关, 我们可以考虑去除其中一个。
一般地, 如果相关系数大于0.7或者小于-0.7, 是高相关的。
相关性系数范围应该是 [-1,1]。

在这里插入图片描述

树模型可以处理非线性模型,并且树模型的区分度更好一些。想象一下决策树和LR。
在这里插入图片描述

弱学习者是问题的特定部分。所以他们通常不会过拟合,这也就意味着弱学习者通常拥有低方差和高偏差。

在这里插入图片描述
t-SNE 算法考虑最近邻点而减少数据维度。所以在使用 t-SNE 之后,所降的维可以在最近邻空间得到解释。但 PCA 不能。
在这里插入图片描述
在这里插入图片描述
通过观察图像我们发现,即使只使用x2,我们也能高效执行分类。因此一开始 w1 将成 0;当正则化参数不断增加时,w2 也会越来越接近 0。
在这里插入图片描述

K-means: 不确定算法。按照定义,从结果上看,就是同样的数据集多次运行K-means算法得到不同的结果(聚类),所以其不是确定算法。从其算法原理看,其不确定性在于我们必须随机选择初始的聚类中心,之后再进行迭代,所以会产生不同的结果。
PCA:确定算法。原因在与,PCA的本质在于求解一个方差最大化问题,给定数据集,最优问题的解是确定且唯一的。

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值