机器学习入门---KNN

最新推荐文章于 2024-07-21 22:04:22 发布

chen_sir_0

最新推荐文章于 2024-07-21 22:04:22 发布

阅读量199

点赞数

分类专栏： python juypter 文章标签：机器学习

本文链接：https://blog.csdn.net/chen_sir_0/article/details/101457118

版权

KNN简介：

作为一种没有显式训练和学习过程的分类和回归算法，k 近邻在众多有监督机器学习算法中算是一种比较独特的方法。说它独特，是因为 k 近邻不像其他模型有损失函数、有优化算法、有训练过程。对于给定的实例数据和实例数据对应所属类别，当要对新的实例进行分类时，根据这个实例最近的 k 个实例所属的类别来决定其属于哪一类。所以相对于其它机器学习模型和算法，k 近邻总体上而言是一种非常简单的方法。

KNN的基本理论：

先来看 k 近邻算法最直观的解释：给定一个训练数据集，对于新的输入实例，在训练集中找到与该实例最近邻的 k 个实例，这 k 个实例的多数属于哪个类，则该实例就属于哪个类。

  从上述对 k 近邻的直观解释中，我们可以归纳出该算法的几个关键点。一是找到与该实例最近邻的实例，这里就涉及到如何找到，即在特征向量空间中，我们要采取何种方式来对距离进行度量。这是我们要考虑的第一个问题。第二则是 k 个实例，这个 k 值的大小如何选择。第三是 k 个实例的多数属于哪个类，明显是多数表决的归类规则。当然还可能使用其他规则，所以第三个关键就是分类决策规则。下面我们分别来看一下这个关键点。

  首先的是距离的度量方式。距离的度量用在 k 近邻中我们也可以称之为相似性度量，即特征空间中两个实例点相似程度的反映。在机器学习中，常用的距离度量方式包括欧式距离、曼哈顿距离、余弦距离以及切比雪夫距离等。在 k 近邻算法中常用的距离度量方式是欧式距离，也即 L2 距离，L2 距离计算公式如下：



  其次是 k 值的选择。一般而言，k 值的大小对分类结果有着重大的影响。当选择的 k 值较小的情况下，就相当于用较小的邻域中的训练实例进行预测，只有当

最低0.47元/天解锁文章

chen_sir_0

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习入门---KNN

KNN简介：作为一种没有显式训练和学习过程的分类和回归算法，k 近邻在众多有监督机器学习算法中算是一种比较独特的方法。说它独特，是因为 k 近邻不像其他模型有损失函数、有优化算法、有训练过程。对于给定的实例数据和实例数据对应所属类别，当要对新的实例进行分类时，根据这个实例最近的 k 个实例所属的类别来决定其属于哪一类。所以相对于其它机器学习模型和算法，k 近邻总体上而言是一种非常简单的方法。K...
复制链接

扫一扫