Knn - 分析手写字体数据集

相关的源代码和数据都在这个github连接

https://github.com/Sangewang/MacEnvPython/tree/master/July/MachineLearn/Knn

#coding=utf-8
import numpy as np
import operator
from os import listdir
#intX是测试集 dataSet是训练集 labels是标签,k是分类
def classifyKnn(intX,dataSet,labels,k):
    dataSetSize = dataSet.shape[0]
    #intX本身是一个1024维度的vector,扩展到dataSetSize行,列只扩展一次,相当于复制数据dataSetSize次
    diffMat = np.tile(intX,(dataSetSize,1)) - dataSet
    #矩阵每个数字做平方
    sqDiffMat = diffMat ** 2
    #axis = 0是在列的方向操作,axis=1是在行的方向上操作
    row_SumDistances = sqDiffMat.sum(axis = 1)
    oushi_distance = row_SumDistances ** 0.5
    '''
    数字:4 3 5 2
    下标:0 1 2 3
    argsort:3 1 0 2 ,即sortedDistIndices存的是3 1 0 2,代表原数组中下标位3的数字最小
    所以sortedDistIndices[0] = 3  代表原数组的2 ->下标3对应的标签找分类
        sortedDistIndices[1] = 1  代表原数组的3 ->下标1对应的标签找分类
    &#
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值