一、概述
最近邻可以分为无监督和有监督,有监督可以分为分类和回归。
最近邻的思想是测试样本距离训练样本的距离。
最近邻是非归纳型方法,是基于实例的方法。它只是记住了训练样本,并按高级索引结构进行转换,比如Ball Tree或者KD Tree。
在sklearn.neighbors中可以处理Numpy数组。
scikit-learn中最近邻有两种方法:K近邻(限定个数)和R近邻(限定距离半径)(会遭遇维度灾难)
权重可以自行设定。
使用最近邻要注意将属性归一化的问题。