Python算法总结(一)KNN分类(附手写python实现代码)

本篇文章是在闭卷之下据我个人的理解一个字一个字写出来,恐有错漏,请谨慎参考。

一、算法类型
有监督的分类算法

二、算法原理
遵循越相近越相似的思想。计算目标样本(无标签,待预测)到所有已知样本集(有标签,已知)的距离集。假设指定近邻为k个,通过对距离集排序后得到k个较小距离的已知样本子集,分析k个近邻已知样本子集的标签分布,遵循少数服从多数的原则,取分布比重最大的标签作为目标样本的预测标签。

三、算法流程
第一步:准备已处理好的已知样本集Data(N个样本,M个特征,1列标签),指定k个近邻;
第二步:计算一个目标样本g到所有已知样本集的距离集D,表示为d0,d1…dN-1;
第三步:对距离集D升序排列,选取前K个距离值及其索引,通过索引定位得到前k个距离对应的已知样本子集k_sub_Data;
第四步:分析已知样本子集k_sub_Data的标签分布,选取分布比重最大的标签max-Label,将该标签赋值给目标样本g作为预测标签。
第五步:循环第二、三、四步骤,可得到目标样本集G的预测标签。
(注:实际调包使用时,将训练集作为已知样本集)

四、手写Python实现

def 
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值