2015.11.27-------KNN算法的python实现的应用

<span style="font-family: Arial, Helvetica, sans-serif;">Python代码:</span>
<span style="font-family: Arial, Helvetica, sans-serif;">def classify0(inX,dataSet,labels,k):    </span>
    dataSetSize=dataSet.shape[0] ##shape代表矩阵的一边的长度
    diffMat=tile(inX,(dataSetSize,1))-dataSet     ##j将inX重复成(dataSetSize,1)的矩阵,减去dataSet,获得每一项的离差
    sqDiffMat=diffMat**2                          ##矩阵的**乘数代表矩阵中每一项自己相乘为乘方
    sqDistances=sqDiffMat.sum(axis=1)             ##将矩阵每一行中的元素相加
    distances=sqDistances**0.5                    ##将矩阵每一项自己取0.5次方
    sortedDistIndicies=distances.argsort()        ##argsot()顺序:从小到大
    classCount={}                                 ##新建一个字典 
    for i in range(k):                            ##从最小的开始到第k小的
        voteIlabel=labels[sortedDistIndicies[i]]
        classCount[voteIlabel]=classCount.get(voteIlabel,0)+1
    sortedClassCount =sorted(classCount.iteritems(),
                             key=operator.itemgetter(1),reverse=True)
    return sortedClassCount[0][0]
</pre><pre name="code" class="python">

编辑:1.tile:tile(A,n),功能是将数组A重复n次,构成一个新的数组,我们还是使用具体的例子来说明问题: 2.举例子:


但是由于矩阵维度的问题,导致无法计算:


[4,4]的矩阵经过[4,1]的重复之后变成了[16,4]的矩阵;这说明,inx应该是用于分类的输入向量,即将对其进行分类,比如,训练样本是[4,4]的矩阵,标记好,矩阵的每一行都是一次样本值,输入样本与[1x4,4]每一个求距离,输出距离最小的那一项对应的标签(如上图)


将labels标记为:'A','B','C','D',然后将数据分类:

得到结果是A



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值