数据挖掘回顾一:分类算法之 kNN 算法


下面用最简洁的话语说明 kNN 算法:


kNN 算法(K 近邻算法)是一种分类算法,即对于给出的一条待分类的数据或待分类的一个东西,我们提取出这条数据的特征值;按照特征值,通过计算与已经分好类的所有条数据之间的一一欧式距离,把这些所有欧式距离排序,挑选出K个最短的距离;对于这K个最短的距离所对应的已经分好类的K个数据,按类别选出出现次数最多的数据们的类别。那么,knn算法就判定,这个类别就是待分类数据或东西的类别。


注意:

1,每一条数据的特征值一般有多个,不同的特征值其单位和大小可能不一样,为了等权重考虑计,计算距离时,一般要每个特征值进行归一化数值操作,即每种特征值的最大值为1。


2, kNN算法的优缺点:





  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值