机器学习实战笔记——KNN算法

最新推荐文章于 2024-07-30 01:28:06 发布

Evitaaaaa

最新推荐文章于 2024-07-30 01:28:06 发布

阅读量1.5k

点赞数 2

分类专栏：机器学习文章标签： KNN算法

本文链接：https://blog.csdn.net/Evitachan/article/details/80750453

版权

本文深入探讨了KNN算法的原理，解释了监督学习的概念，并通过 iris 数据集展示了KNN如何工作。此外，还介绍了如何利用KNN预测泰坦尼克号乘客的生存情况，强调了k值选择对分类效果的影响，以及在实践中调整k值以优化模型的重要性。

摘要由CSDN通过智能技术生成

KNN算法是监督学习分类方法。何为监督学习？我们用来训练的数据集应当包括数据特征和标签两个部分，通过训练建立数据特征和标签之间关系的算法模型，这样的话，将测试数据集套用算法模型，可以得到测试数据的标签。

一 KNN算法原理

在训练样本集中每个数据都存在标签，即我们知道样本集中每一数据与所属分类的对应关系。输人没有标签的新数据后，将新数据的每个特征与样本集中数据对应的特征进行比较，然后算法提取样本集中特征最相似数据（最近邻）的分类标签。选择k个最相似数据中出现次数最多的分类，作为新数据的分类。在KNN中，通过计算对象间距离作为各个对象之间的相似性指标，代替对象之间的匹配度计算。

对于训练样本数为m，特征数为n的训练样本集，计算测试样本x与m个训练样本的欧氏距离