《机器学习实战》 学习笔记 Classifying with k-Nearest Neighbors (k-邻近算法)

 Classifying with k-Nearest Neighbors (k-邻近算法)

本文我们要学习内容

  • k-邻近分类算法
  • 从文本文件中解析和导入数据
  • 使用Matplotlib包创建扩散图
  • 归一化数值

k-邻近分类算法

    简单的货, k-近邻算法(kNN) 采用 测量不同特征值之间的距离的方法来进行分类。

例如:

对象特征1特征2分类
A3104类别1
B2100类别1
C181类别1
D10110类别2
E995类别2
F982类别2
unknow1890未知

    即使不知道unkonw 是属于哪个分类,我们也可以通过某种方法计算出来。 首先计算unknow样本和样本集中的其他对象特征的距离,此处暂时不关心如何计算这些距离值,在具体的分类器中有具体的算法提供

对象与unknown的距离
A20.5
B18.7
C19.2
D115.3
E117.4
F118.9

我们得到了unknown与其他样本的距离,排序后可以找到k个距离unknown最近的样本。假定k=3,则三个最靠近的样本风别是A,B,C k-近邻算法按照距离最近的三个样本的类型,决定unknown样本的类型为 类别1.

 

k-近邻算法的一般流程为

  • 收集数据:可以使用任何方法
  • 准备数据:距离计算所需要的数值,最好是结构化的数据格式。
  • 分析数据:可以使用任何方法
  • 训练算法:此步骤不适合k-近邻算法。
  • 测试算法:计算错误率
  • 使用算法:首先需要输入样本数据和结构化的速出结果,然后运行k-近邻算法判定输入数据分别独属于哪个分类,最后应用对计算出的分类执行后续的处理。

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值