kNN分类算法

最新推荐文章于 2024-07-20 17:12:48 发布

Vicky_ding

最新推荐文章于 2024-07-20 17:12:48 发布

阅读量392

点赞数 1

分类专栏： Machine Learning in Action 文章标签： kNN python

本文链接：https://blog.csdn.net/qq_33457248/article/details/79535594

版权

kNN算法是一种基于距离度量的分类方法，通过计算未知类别数据点与已知类别数据点的距离，按距离排序，选取最近的k个点，根据这k个点的类别频率来预测未知点的分类。本文将详细介绍kNN的工作原理，并提供使用scikit-learn库及纯Python逐步实现的代码示例。

摘要由CSDN通过智能技术生成

一、概述

kNN算法采用测量不同特征值之间的距离方法进行分类。对未知类别属性的数据集中的每个点执行如下操作：

（1）计算已知类别数据集中的点与当前点之间的距离；

（2）按照距离递增次序排序；

（3）选取与当前点距离最小的k个点；

（4）确定前K个点所在类别的出现频率；

（5）返回前k个点出现频率最高的类别作为当前点的预测分类。

二、代码实现

1.基于scikit-learn包实现

import numpy as np
from sklearn import neighbors

def split_data(data, test_size):
    data_num = data.shape[0]
    train_ind = list(range(data_num))
    test_ind = []
    test_num = int(data_num * test_size)
    for i in range(test_num):
        rand_ind = np.random.randint(0, len(train_ind))
        test_ind.append(rand_ind)
        del train_ind[rand_ind]
    train_data = data[train_ind]
    test_data = data[test_ind]
    return train_data, test_data

# load the data and divide the data
mydata = n

最低0.47元/天解锁文章

Vicky_ding

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
kNN分类算法

一、概述 kNN算法采用测量不同特征值之间的距离方法进行分类。对未知类别属性的数据集中的每个点执行如下操作：（1）计算已知类别数据集中的点与当前点之间的距离；（2）按照距离递增次序排序；（3）选取与当前点距离最小的k个点；（4）确定前K个点所在类别的出现频率；（5）返回前k个点出现频率最高的类别作为当前点的预测分类。二、代码实现 1.基于scik...
复制链接

扫一扫

专栏目录