knn 最近邻 算法的思考 与 总结

算法功能分类(核心功能),回归
算法类型有监督学习,惰性学习(没有产生模型),距离类模型
数据输入

包含数据标签y,特征空间中至少包含K个训练样本

特征空间中各个特征的量纲需要统一,若不统一则需要进行归一化处理

自定义超参数k

模型输出

在knn分类中,输出是标签中的某个类别

在knn回归中,输出是对象的属性值,该值是距离输入的数据最近的k个训练样本标签的平均值

  

1.优点

     1.1 简单好用 ,容易理解, 精度高,理论成熟,可以用来做分类也可以用来做回归

     1.2可以用于数值型数据,也可以用于离散型数据

    1.3无数据输入的假定

     1.4适合对稀有事件进行分类

 

 

2 缺点  :

     计算复杂性高,空间复杂性高

     计算量太大,所以一般数值很大的时候不用这个,但是单个样本有不能太少,否则容易发生误分

      样本不平衡问题,

       可理解性比较差,无法给出数据的内在含义

 

The more important is  python 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值