KNN最邻近算法

KNN算法是一种预测时才运算的方法,通过计算样本间的距离找到最近的点来决定预测分类。通常,会依据距离的权重来判断,多数类别的样本决定预测类别。为了提高准确性,数据预处理阶段会进行归一化,以解决特征值范围差异导致的权重不平等问题。
摘要由CSDN通过智能技术生成
优点:精度高,对异常值不敏感,无数据输入假定。
缺点:计算复杂度高,空间复杂度高。
适用范围:数值型和标称型。

  1. KNN算法是在预测的时候才进行运算的。
  2. 简要介绍步骤就是,准备好一堆样本,想象一下每个样本在空间分布,它的坐标就是他的几个特征值。
  3.  当需要预测时,求出与样本距离最近的几个点,通过这几个点来判断预测点的分类。
  4. 在判断的时候,可以通过数不同样本的数量数,最多的即为预测类
  5. 但是一般情况,与样本的距离不同,权重也会不同,所以为了精确也会根据与那一类的权值大小来判断预测点的类别。
  6. 优化:在进行数据准备时,可以对数据范围差值很大的数据进行归一化处理,以解决不同特征的权重不同的问题
  7. 详细解释:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值