【python】KNN及实例

1. 什么是KNN

KNN(K-Nearest Neighbors, k近邻算法)用于分类的算法

2. KNN流程

  1. 计算新样本与所有样本之间的距离(①欧氏距离: 两点之间的直线距离 ②曼哈顿距离:坐标轴距离的绝对值的和)
  2. 按照由近及远顺序排列(knn中的k是邻居个数,离的最近的k个样本来判断新数据的类别)
  3. 再按K值确定分类
    (对此knn缺点:数据越多knn计算量越大,很难应用到较大数据集中)
    在这里插入图片描述

3. KNN案例

  1. 创造数据集
  2. KNN函数,进行分类
  3. 计算欧式距离
  4. 排序,对数据进行排序,并返回排序前所在位置的索引
  5. 创建字典并初始化
  6. 统计表决,对字典进行填充
  7. 表决后进行降序排序,距离最近的k个训练数据中大多数所属的类别即为测试数据的类别
  8. 测试数据
    在这里插入图片描述
    在这里插入图片描述

4. 完整实例代码python

import numpy as  np
import operator

def DataSet():
    group=np.array([[50,2],[45,3],[46,1],[3,36],[4,35],[2,38]])
    labels=['司六','司六','司六','米希','米希','米希']
    return group,labels
def KNN(x_input,x_labels,y_labels,k):
    x_labels_size=x_labels.shape[0]
    # 在numpy中,np.tile(a, (2))函数的作用就是将函数将函数沿着X轴扩大两倍。如果扩大倍数只有一个,默认为X轴
    # np.tile(a, (2, 1))第一个参数为Y轴扩大倍数,第二个为X轴扩大倍数
    # **2是平方
    distances=(np.tile(x_input,(x_labels_size,1))-x_labels)**2
    # sum()函数axis=1按列进行相加
    # **0.5开方
    ou_distances=distances.sum(axis=1)**0.5
    # argsort()排序
    sq_distances=ou_distances.argsort()
    classdict={}
    # 利用字典统计列表中元素出现次数
    # a={}
    # for i in range(2):
    #     a['kk']=a.get('kk',2)+2
    #     print(a)
    #     print(a['kk'])
    for i in range(k):
        index_label=y_labels[sq_distances[i]]
        # print(index_label)
        classdict[index_label]=classdict.get(index_label,0)+1
        # print(classdict)
        # print(classdict[index_label])
    sort_classdict=sorted(classdict.items(),key=operator.itemgetter(1),reverse=True)
    # print(sort_classdict)
    # print(sort_classdict[0])
    # print(sort_classdict[0][0])
    return  sort_classdict[0][0]
if __name__ == '__main__':
    group,labels=DataSet()
    test_x=[30,2]
    print('输入数据的类型为:{}'.format(KNN(test_x,group,labels,3)))
  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

司六米希

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值