目录
备注:本文主要来自于对《深入浅出python机器学习》书籍的学习总结笔记,感兴趣的同学可以购买本书学习,学习的本质就是形成自己的逻辑。
1. K最近邻算法原理
基本思想:一个样本在特征空间中,总会有k个最临近的样本。
如在左边的图中,最近邻数k=1,即找到与问号样本最近的一个点,该点是灰色,因此将问号样本分类为灰色;
在右边的图中,最近邻数k=3,即找到与问号样本最近的3个点,发现有1个是灰色,2个是黑色,因此将问号样本分类为黑色。
这里举的是分类案例,实际上K最近邻算法也可用于回归,原理和用于分类相同。预测一个问号样本的的y值,模型会找到距离该问号样本最近的k个训练数据集中的点,并且将它们y值取平均值作为该问号样本的预测值。