k近邻算法理论(一)

本文介绍了k近邻算法的基本思想和工作流程,包括k值选择、距离度量和分类决策规则。k近邻算法通过找到新实例最近的k个训练实例,依据多数表决来决定新实例的类别,其模型建立在特征空间的划分上。文章讨论了不同距离度量方法,如欧式距离,并分析了k值选择对模型复杂度和预测准确性的影响。
摘要由CSDN通过智能技术生成

时间 :2014.07.05

地点:基地

-----------------------------------------------------------------------------------

一、简述

  K近邻法(k-nearest neighbor,kNN)是一种基本分类与回归方法。k近邻的输入为实例的特征向量,对应特征空间中的点,输出为实例的类别。k近邻算法的基本思想是:给定训练数据集,实例类别已定,在对目标实例进行分类时,我们根据与目标实例k个最近邻居的训练实例的类别,通过多数表决的方式进行决定。也就是说,k近邻算法实际上是利用了训练数据集对特征向量空间进行了划分,并作为其分类的模型。这样k近邻算法涉及三个最基本的元素:

1.k值的选择,即取多大的k最适合于分类

2.距离的度量,即怎么样一个距离计算判断是否为目标实例的邻居

3.分类决策

-----------------------------------------------------------------------------------

二、k近邻算法

输入:给定训练数据集

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值