K近邻法

    k近邻法是一种基本分类与回归方法。

    k紧邻法的三个基本要素:k值的选择、距离度量、分类决策规则。

一、k近邻算法

    输入:训练数据集T,要预测的特征向量x。

    输出:特征向量x对应实例的类别y。

    步骤:1.根据给定的距离度量,在训练集T中找出与x最近邻的k个点。

                2.依据找出的k个点,根据决策规则决定x的类别y。

                对分类模型,一般是对k个点进行投票,选择最多的类别。对于回归模型,取k个点对应y的平均值。

二、k近邻模型

    1.距离度量:特征空间中两个实例点的距离是两个实例点的相似程度的反映,一般使用欧氏距离。

    距离定义:

    p=2,称为欧氏距离,p=1称为曼哈顿距离,p=时,它是各个坐标距离的最大值。

    2.k值得选择

    k值选择较小:学习的估计误差会增大,预测结果会对实例点十分敏感,模型变得复杂,容易发生过拟合

    k值选择较大:学习的近似误差会增大,与预测实例较远的点也会起预测作用,模型变得简单。

    一般k选择一个比较小的值,采用交叉验证来选取最优。

    3.分类决策规则

    分类:一般是多数表决,等价于经验风险最小化。

    回归:取平均值。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值