KNN(K临近算法)

一、KNN算法的定义

 已知训练集中的特征值和分类值,输入一个需要分类的数据点A,判断和A欧式距离最短的K个点,求这K个点中分类占比最多

的分类作为A点的类别。KNN算法比较简单,可以用于分类,也可以用于回归(临近点的均值做结果)。


二、KNN算法优缺点

 优点:1、简单、容易实现和理解,不需要参数估计和训练

  2、适用于对稀有事件进行分类

3、特别适用多分类问题,比SVM表现要好。

缺点:1、当样本不平衡时,如一个分类样本多,一个分类样本少,有可能导致输入一个新样本,该样本永远都属于样本多 

的那一分类。改进方法:采用权值,与该样本距离小的邻居权值大。

  2、计算量大,新输入一个样本,需要跟所有样本点做欧氏距离计算,排序选出K个最邻近点。改进方法:预先去除

  对分类作用不大的样本。(如:以新入样本为圆心,经验值为半径,挑选圆内K个点,如不足K个点,再逐步放大

半径)。该改进算法比较适用于容量大的类域,而容量较小的类域容易产生误分。


三、KNN算法python实现(预测花的品种)

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值