监督学习算法(二):KNN算法

二. KNN算法(临近取样算法)

1. 步骤:为了判断未知实例的类别,以所有已知类型的实例作为参照,选择参数k(k值不好选,选小了过拟合,选大了欠拟合),计算未知实例与所有已知实例之间的距离,从中选择K个,根据少数服从多数的原则,将其归类为K个当中最多数的类别。

2. 距离的衡量方法:直线距离,余弦值,相关度,曼哈顿距离。

3. 算法优缺点: 算法简单,易于理解,容易实现。但是需要大量的空间来存储已知实例,算法的复杂度很高。而且当样本分布不平衡时,也许结果就不太对了,因为样本数量过大,很容易就成为了一个主导样本。

4. KNN改进:考虑权重,也就是用1去除以距离。

希望能够帮到你~~~~~

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值