【机器学习实战 Task1】（KNN）k近邻算法的应用_k近邻算法应用领域相关代码(2)

2401_84692226

于 2024-05-03 01:45:34 发布

阅读量333

点赞数 3

分类专栏：程序员文章标签：机器学习近邻算法人工智能

本文链接：https://blog.csdn.net/2401_84692226/article/details/138405160

版权

程序员专栏收录该内容

109 篇文章 0 订阅

订阅专栏

根据knn算法的原理，我们可以求出，未知电影与每部电影之间的距离(这里采用欧式距离）

以California Man为例

>>>((3-18)**2+(104-90)**2)**(1/2)
20.518284528683193


电影名称	与未知i电影之间的距离
California Man	20.5
He‘s Not Really into Dudes	18.7
Beautiful Woman	19.2
Kevin Longblade	115.3
Robo Slayer 3000	117.4
Amped II	118.9

因此我们可以找到样本中前k个距离最近的电影，假设k=3，前三部电影均为爱情片，因此我们判定未知电影属于爱情片。

1.2 用python代码实现k近邻算法

（1）计算已知类别数据集中的每个点与当前点之间的距离

（2）按照距离递增次序排序

（3）选取与当前点距离最小的k个点

（4）确定前k个点所在类别出现的频率

（5）返回前k个点出现频率最高的类别作为当前点的预测分类

import numpy as np
import operator

def classify0(inX, dataSet, labels, k):
    dataSetSize = dataSet.shape[0]
    diffMat = np.tile(inX, (dataSetSize,1)) - dataSet
    sqDiffMat = diffMat**2
    sqDistances = sqDiffMat.sum(axis=1)
    distances = sqDistances**0.5
    sortedDistIndicies = distances.argsort()     
    classCount={}          
    for i in range(k):
        voteIlabel = labels[sortedDistIndicies[i]]
        classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1
    sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True)
    return sortedClassCount[0][0]

（6）案例

>>>group = np.array([[1, 1.1],
...                 [1, 1],
...                 [0, 0],
...                 [0, 0.1]])
>>>labels = ['A', 'A', 'B', 'B']
>>>classify0([0,0], group, labels, 3)
'B'

1.3 如何测试分类器

正常来说为了测试分类器给出来的分类效果，我们通常采用计算分类器的错误率对分类器的效果进行评判。也就是采用分类出错的次数除以分类的总次数。完美的分类器的错误率为0，而最差的分类器的错误率则为1。

2 使用kNN算法改进约会网站的匹配效果

一、Python所有方向的学习路线

Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。

二、Python必备开发工具

工具都帮大家整理好了，安装就可直接上手！

三、最新Python学习笔记

当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理解，这些理解是比较独到，可以学到不一样的思路。

四、Python视频合集

观看全面零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

五、实战案例

纸上得来终觉浅，要学会跟着视频一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

六、面试宝典

在这里插入图片描述

简历模板

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友，可以戳这里无偿获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

2401_84692226

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
【机器学习实战 Task1】（KNN）k近邻算法的应用_k近邻算法应用领域相关代码(2)

根据knn算法的原理，我们可以求出，未知电影与每部电影之间的距离(这里采用欧式距离）以California Man为例因此我们可以找到样本中前k个距离最近的电影，假设k=3，前三部电影均为爱情片，因此我们判定未知电影属于爱情片。
复制链接

扫一扫