【机器学习实战】学习笔记 | K-近邻算法

最新推荐文章于 2023-06-12 15:47:45 发布

Leonadoice

最新推荐文章于 2023-06-12 15:47:45 发布

阅读量190

点赞数

分类专栏：机器学习与深度学习实战

本文链接：https://blog.csdn.net/qq_43145926/article/details/109293748

版权

本文介绍了K-近邻算法的工作原理、优缺点以及适用数据类型。算法通过比较新数据与样本集特征距离来分类，其精度高但计算复杂度高。适用场景包括数值型和离散型数据。流程包括数据收集、准备、分析、测试和实际应用。案例展示了二维数据如何通过计算欧式距离找到最近的k个点，以确定测试样本的类别。

摘要由CSDN通过智能技术生成

k-近邻算法采用测量不同特征值之间的距离方法进行分类。knn算法不需要经过训练就可以直接计算测试集。knn算法并不一定完全正确，错误率为输出错误的次数除以总的执行次数。

优缺点：

原理：

K-近邻算法的一般流程：

案例：
输入一个二维测试集，算出它与所有训练集的距离，取前k个距离最近的点并统计这k个点类别的频率，输出频率最大的类别即为测试集最可能的类别。

import numpy as np
import operator
'''
group-数据集
labels-分类标签
'''
def createDataSet():
    #四组二维特征
    group=np.array([[1,101]

关注

专栏目录