K-邻近算法

K-邻近算法

  • 采用测量不同特征值之间的距离来进行分类

  • Ad:精度高,对异常值不敏感,无数据输入假定
  • Na:计算复杂度高,空间复杂度高

KNN原理

存在样本集,每个数据都存在标签,输入无标签的新数据后,算法提取出特征最相似的标签。
一般选取前K个数据,通常K不大于20,最后选择K个最相似的数据中出现次数最多的分类,作为新数据的分类标签。

适用

数值型和标称型

算法流程

  • 收集数据
    any method

  • 准备数据
    计算距离数值,最好为格式化的数据

  • 分析数据
    any method

  • 训练算法
    不适用KNN算法

  • 测试算法
    计算错误率

  • 使用算法
    实际应用

转载于:https://www.cnblogs.com/Jhon95/p/6151821.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值