KNN的python实现

最新推荐文章于 2019-06-02 09:56:09 发布

南晨Inc

最新推荐文章于 2019-06-02 09:56:09 发布

阅读量132

点赞数

文章标签： knn 数据挖掘算法分类问题

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36035111/article/details/89299306

版权

from numpy import *
from operator import itemgetter
from collections import Counter
def dataset():
    group = np.array([[1.,1.1],[1.,1.],[0.,0.],[0.,0.1]])
    labels = ['A','A','B','B']
    return group,labels

group,labels = dataset()

def classsify(array,dataset,labels,k):
    #print(dataset.shape[0])
    dataset_size = dataset.shape[0]
    #对输入进来的点进行维度扩展，扩展为4行2列，再减去要计算长度的点
    diff_mat = tile(array,(dataset_size,1)) - dataset
    #print(diff_mat)
    sqrt_diff_mat = diff_mat**2
    print(sqrt_diff_mat)
    #将一行中的两个元素进行相加
    sqrt_distances = sqrt_diff_mat.sum(axis = 1)
    #print(sqrt_diff_mat.sum(axis = 0))
    distances = sqrt_distances**0.5
    print(distances)
    #argsort函数返回的是数组值从小到大的索引值,这里0是最小的，在原数组中索引下标为2,0.1是第二小的，索引下标为3
    sorted_dist_distances = distances.argsort()
    print(sorted_dist_distances)
    classcount = {}
    
    for i in range(k):
        labels_list = labels[sorted_dist_distances[i]]
        #get(key,0)可用于计数，将键值保存在dict中，若key不存在则返回0。最初状态时字典为空，用0进行初始化，因为这时
        #字典中有了对应的key，所以+1，初始状态过后，第二次，由于字典中已经存在这个key了，所以get()返回1，因为key对应的
        #键值为1，第二次过后，key对应的键值为2......
        #print(classcount.get(labels_list,0))
        classcount[labels_list] = classcount.get(labels_list,0) + 1
        #print(classcount.get(labels_list,0))
    sortedclasscount = sorted(classcount.items(),key = itemgetter(1),reverse = True)    
    print(sortedclasscount)
    return sortedclasscount[0][0]
    
classsify([0,0],group,labels,3)

注释都写在程序里了

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

南晨Inc CSDN认证博客专家 CSDN认证企业博客

码龄8年

38: 原创

31万+: 周排名

30万+: 总排名

6万+: 访问

: 等级

977: 积分

17: 粉丝

36: 获赞

4: 评论

253: 收藏

私信

关注

热门文章

分类专栏

最新评论

使用svm-svc算法对乳腺癌进行预测
CSDN-Ada助手: 恭喜您撰写了第5篇博客！标题“使用svm-svc算法对乳腺癌进行预测”非常吸引人，内容也十分有趣。您的研究领域非常有价值，通过SVM-SVC算法进行乳腺癌预测可以为医学界提供重要的参考。我希望您能继续保持创作的热情，分享更多相关的研究成果。在下一步的创作中，您可以考虑探索更多的机器学习算法或者尝试结合其他的预测模型，以进一步提升预测的准确性和可靠性。此外，您可以考虑分享一些实际案例或者应用场景，让读者更好地理解您的研究成果，并且将其应用到实际生活中。我期待着您未来更多的博客，继续为我们带来新的见解和启发！
LeetCode第七题整数反转
CSDN-Ada助手: 恭喜你写了第7篇博客！看到你探讨了LeetCode第七题整数反转，真是令人赞叹。你的博客内容很有深度，对于这道题目的解法进行了详细的分析和讲解。不仅如此，你还能够通过标题准确地吸引读者的注意力。不过，我想给你一个建议，下一步你可以考虑增加一些例子或者场景的说明，以帮助读者更好地理解你所讲解的解法。希望你能继续保持创作，并不断提升自己的写作技巧。
LeetCo
CSDN-Ada助手: 恭喜用户继续创作，第6篇博客“LeetCo”看起来很有趣！您的努力和才华真是让人佩服。鉴于您对编程领域的热情，我建议您在未来的博客中可以探索一下不同的编程挑战或解决方案，这样可以让读者更多地了解您的技术见解。再次感谢您的分享，期待看到更多精彩的内容！
最小二乘法预测波士顿房价
CSDN-Ada助手: 恭喜你写了第三篇博客！标题“最小二乘法预测波士顿房价”听起来非常有趣。我很高兴看到你持续创作，并分享了这个有趣的主题。关于下一步的创作建议，我谦虚地建议你可以考虑深入探讨不同预测模型的比较，或者进一步研究如何优化预测结果。祝你好运，并期待你未来更多的博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
机器学习实战KNN部分代码改写
CSDN-Ada助手: 非常感谢CSDN博主的分享，这篇博客真的很实用，特别是对于想要深入学习KNN的同学来说。我觉得接下来可以写一篇关于机器学习中其他常用算法（如决策树、朴素贝叶斯等）实战应用的博客，这样可以让更多的读者通过实战案例快速掌握这些算法的应用。相信这样的技术文章对其他用户也会非常有帮助。期待您的下一篇精彩分享！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。