机器学习--k-近邻(kNN, k-NearestNeighbor)算法

K-近邻(KNN)算法是机器学习中一种简单的分类方法,基于实例学习和懒惰学习。算法通过计算测试样本与训练集中样本的距离,选择最近的k个点,根据这些点的多数类别来决定测试样本的分类。K的选择至关重要,太小易受噪声影响,太大可能导致过拟合。通常采用交叉验证来确定最佳K值。KNN在处理边界不规则和样本不均衡的数据集时表现出色,但计算复杂度高,适用于小规模数据集。为提高效率,可以利用kd-tree等数据结构。
摘要由CSDN通过智能技术生成

机器学习--k-近邻(kNN, k-NearestNeighbor)算法

 

一、算法概述

  • 邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。
  • Cover和Hart在1968年提出了最初的邻近算法。
  • KNN是一种分类(classification)算法,它输入基于实例的学习(instance-based learning),属于懒惰学习(lazy learning)即KNN没有显式的学习过程,也就是说没有训练阶段,数据集事先已有了分类和特征值,待收到新样本后直接进行处理。与急切学习(eager learning)相对应。
  • KNN是通过测量不同特征值之间的距离进行分类。 

  提到KNN,网上最常见的就是下面这个图,可以帮助大家理解。

  我们要确定绿点属于哪个颜色(红色或者蓝色),要做的就是选出距离目标点距离最近的k个点,看这k个点的大多数颜色是什么颜色。

        当k取3的时候,我们可以看出距离最近的三个,分别是红色、红色、蓝色,因此得到目标点为红色。

【算法原理】

  • 如果一个样本在特征空间中
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

SUNNY小飞

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值