算法功能 | 分类(核心功能),回归 |
算法类型 | 有监督学习,惰性学习(没有产生模型),距离类模型 |
数据输入 | 包含数据标签y,特征空间中至少包含K个训练样本 特征空间中各个特征的量纲需要统一,若不统一则需要进行归一化处理 自定义超参数k |
模型输出 | 在knn分类中,输出是标签中的某个类别 在knn回归中,输出是对象的属性值,该值是距离输入的数据最近的k个训练样本标签的平均值 |
1.优点
1.1 简单好用 ,容易理解, 精度高,理论成熟,可以用来做分类也可以用来做回归
1.2可以用于数值型数据,也可以用于离散型数据
1.3无数据输入的假定
1.4适合对稀有事件进行分类
2 缺点 :
计算复杂性高,空间复杂性高
计算量太大,所以一般数值很大的时候不用这个,但是单个样本有不能太少,否则容易发生误分
样本不平衡问题,
可理解性比较差,无法给出数据的内在含义
The more important is python