K最近邻算法

最新推荐文章于 2024-08-11 22:50:26 发布

ChanKamShing

最新推荐文章于 2024-08-11 22:50:26 发布

阅读量2.7k

点赞数 1

分类专栏：大数据数据结构与算法

本文链接：https://blog.csdn.net/weixin_39400271/article/details/100991364

版权

K最近邻算法（KNN）是一种基本的分类算法，根据最近的K个邻居的类别来预测未知样本的类别。本文介绍了KNN的基本原理，包括相似度计算、距离排序、标签统计和预测，并探讨了K值选择对算法的影响。接着，通过一个Python实例展示了如何使用KNN进行性别判定。

摘要由CSDN通过智能技术生成

K最近邻算法（K-Nearest Neighbor， KNN）是最基本的分类算法，其基本原理是：从最近的K个邻居（样本）中，选择出现次数最多的类别作为判定类别。K最近邻算法可以理解为是一个分类算法，常用于标签的预测，如性别。

实现KNN算法核心的一般思路：

K值的选择是选择统计的样本数量，K值得选择会对KNN算法产生较大得影响。

在实际上，K值一般选择较小的数，也可以选择交叉验证的方法寻找最优K值。

利用KNN算法实现性别判定：很多时候，用户在注册的时候，没有填写性别，这个时候，可以通过KNN预测。

import numpy as np

class KNN:
    def __init__(self, k):
        self.k = k

    def createData(self):
        features = np.arr

关注

专栏目录