【一起入门MachineLearning】中科院机器学习-期末题库-【计算题13+简答题3,22+单选题58,82+多选题19】

本文围绕周晓飞老师的期末题库,详细解析了K均值算法的计算题、简答题,讨论了其受初始值和离群点影响的稳定性问题,以及如何通过数据归一化、离群点处理和核函数等方式进行算法调优。涵盖了K均值的优缺点和常见应用场景。
摘要由CSDN通过智能技术生成

这系列的题目来源于周晓飞老师期末发的题库,自留做复习用的🎉 🎉 🎉 加油加油!

知识点可以参考这篇博客:【一起入门MachineLearning】中科院机器学习第*课-聚类算法:K均值(K-means)

计算题13

在这里插入图片描述
在这里插入图片描述
不想计算距离的话直接画图会更加快。
在这里插入图片描述
在这里插入图片描述

简答题3

在这里插入图片描述
在这里插入图片描述

单选题82

在这里插入图片描述
这个题目的计算方法和上两个题一样,不再赘述。

单选题58

在这里插入图片描述

  • k均值会受到初始值和离群点的影响,导致每次的分类结果不稳定,B正确。
  • k均值比较高效,时间复杂度接近线性,C错误。
  • 可以采用核函数的方法对k均值算法进行调优,D错误。

多选题19

在这里插入图片描述

  • 相似性度量也就是计算距离的方式。相似性度量,初始聚类,离群点都会影响分类结果,答案选择BC

简答题22

22.K均值算法的优缺点是什么,如何对其调优。
缺点:

  • 受初值和离群点的影响每次的结果不稳定
  • 结果通常不是全局最优而是局部最优解
  • 无法很好地解决数据簇分布差别比较大的情况
  • 不太适用于离散分类

优点:

  • 对于大数据集,相对高效 ,计算复杂度是 O(NKt) 接近于线性,其中N是数据对象的数目,K是聚类的簇数,t
    是迭代的轮数。

调优方法:

  • 数据归一化
  • 离群点预处理
  • 采用核函数
  • 合理选择K值。
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

vector<>

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值