《统计学习方法》三:手推“k近邻法”

第三章 k k k近邻法

k-NN是一种基本的分类和回归方法,没有显式的表达过程。

3.1. k k k近邻算法
k k k近邻算法是给定一个训练数据集,对于新的输入实例,在训练数据集中找到与该实例最近的 k k k个实例。将这 k k k个实例中多数属于的类别作为输入实例的类别预测值。具体算法如下:
在这里插入图片描述
3.2. k k k近邻模型
决定 k k k近邻模型的三要素:距离度量、 k k k值的选和分类决策规则
3.2.1.模型
通过每个实例的邻域将特征空间进行划分。
3.2.2.距离度量
在这里插入图片描述
3.2.3. k k k值的选择
可知较小的 k k k使实例的预测的近似误差减小,但由于 k k k小,会对邻近的 k k k个实例更加敏感,容易过拟合,增大估计误差。
k k k值过大会减小估计误差,增大近似误差。当 k k k等于训练集样本个数是,总是使用训练集中样本最多的一类进行预测。

3.2.4.分类决策规则
在这里插入图片描述
3.3. k k k近邻法的实现: k d kd kd
3.3.1.构造 k d kd kd
k d kd kd树是一颗二叉树,构造 k d kd kd树相当于不断的用垂直于坐标轴的场平面将 k k k维空间切分,构成一系列的 k k k维超矩形区域(注意:此处的 k k k代表维度,与 k k k近邻法的 k k k无关)。
在这里插入图片描述
3.3.2.搜索kd树
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值