机器学习算法（一）KNN近邻算法

最新推荐文章于 2024-08-12 19:04:41 发布

J_Anson

最新推荐文章于 2024-08-12 19:04:41 发布

阅读量1k

点赞数

文章标签：算法机器学习近邻算法 KNN

本文链接：https://blog.csdn.net/j_anson/article/details/131224979

版权

本文介绍了K-Nearest-Neighbor（KNN）算法的基本概念，包括算法原理、步骤以及如何在iris数据集上进行预测。KNN是一种简单而常用的分类算法，通过对数据的预处理和距离计算，将新样本分类到最近K个点中最多的类别。文中还提及了闵氏距离及其特殊情况如欧氏距离和曼哈顿距离。

摘要由CSDN通过智能技术生成

一、KNN算法概述

KNN：K-Nearest-Neighbor算法，即K值为邻近。KNN是最简单的分类算法之一，同时，也是最常用的分类算法之一。KNN算法是有监督学习中的分类算法。

二、原理

基于基于iris数据集，具体经历下面四步流程：
①载入数据，对数据进行预处理（缺失值处理、标准化等，其中iris数据集数据全面，无需进行缺失值处理）。
②计算待分类点到其他每个样本点的距离。
③对每个距离进行排序，然后选择出距离最小的K个点。
④对K个点所属的类别进行比较，根据少数服从多数的原则，将待分类点归入在K个点中占比最高的那一类。

三、相关基础知识的扩展

（1）对缺失值补全的方法，此处采用对缺失值填充当列数据的平均值的方法

# 缺失值处理
for i in iris_dataset.columns:
    if not np.all(pd.notnull(iris_dataset[i])):
        iris_dataset[i].fillna(iris_dataset[i].mean())

（2）距离计算公式，包括闵式距离（含欧式距离、曼哈顿距离和切比雪夫距离）、标准化欧式距离（排除数据量纲的影响）、余弦距离、杰卡德距离（求交集、并集间距离）、汉明距离（密码学常用，求字符串间距离）、马氏距离（求分布数据距离）。下面详细介绍闵式距离。

闵氏距离又叫做闵可夫斯基距离，是

最低0.47元/天解锁文章

J_Anson

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法（一）KNN近邻算法

KNN（K近邻算法）：K-Nearest-Neighbor算法，即K值为邻近。KNN是最简单的分类算法之一，同时，也是最常用的分类算法之一。KNN算法是有监督学习中的分类算法。
复制链接

扫一扫