python之K-近邻算法

1.计算预期样本与测试集样本的距离
2.通过K值筛选出与预期样本最近的测试样本
3.根据已特征选取的样本中各分类标签所占的比例来确定预期样本的分类
笔记:

  1. 当属性的极值范围较大时,可对其进行归一化处理,以减少该属性对分类器权重的影响
  2. 深刻理解:对象-》数值描述深刻理解:对象-》数值描述

总结:

  • K近邻算法是分类数据最简单最有效的算法,是基于实例的学习,使用算法时我们必须有接近实际数据的训练样本数据。
  • K-近邻算法必须保存全部数据集,如果训练数据集的很大,必须使用大量的存储空间。此外,由于必须对数据集中的每个数据计算距离值,实际使用时可能非常耗时。
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值