k近邻法——原理篇

本文深入探讨k近邻(k-Nearest Neighbors, k-NN)法,包括模型的三大要素:k值选择、距离度量和分类决策规则。k值的平衡关乎过拟合与估计误差;距离度量涉及欧式距离、Lp距离等;分类决策常用多数表决原则。算法部分阐述了k-NN的基本步骤,并提及了kd树作为高效搜索方法在大数据集中的应用。" 50499999,4980841,DialogFragment全屏宽度设置,"['android', 'DialogFragment', '屏幕适配', '自定义布局']
摘要由CSDN通过智能技术生成

k近邻法是一种基本分类与回归方法,书中只讨论了分类问题的k近邻法。

一、模型

k近邻模型对应于特征空间的划分,由k值的选择、距离度量及分类决策规则三个基本要素决定。

二、策略

(一)k值的选择

k值的选择反映了对近似误差与估计误差之间的权衡,通常由交叉验证选择最优的k。
k值小时,近似误差较小,估计误差较大,模型较复杂,容易发生过拟合;
k值大时,估计误差较小,近似误差较大,模型较简单,预测错误率较高。

(二)距离度量

常用的方法是欧式距离、 L p L_p Lp距离。
两个n维向量 x i , x j x_i,x_j xi,xj L p L_p Lp距离定义为
L p ( x i , x j ) = ( ∑ l = 1 n ∣ x i ( l ) − x j ( l ) ∣ p ) 1 p , p ≥ 1 L_p(x_i,x_j)=({\sum\limits_{l=1}^n|x_i^{(l)}-x_j^{(l)}|^p})^{\frac{1}{p}},\quad p\geq1 Lp(xi,xj)=(l=1nxi(l)xj(</

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值