Python中最近邻算法实现简介

最新推荐文章于 2024-07-10 11:21:17 发布

嗷呜大嘴狼

最新推荐文章于 2024-07-10 11:21:17 发布

阅读量1.1k

点赞数 1

文章标签： python 近邻算法开发语言

原文链接：https://www.ktiao.com/python/2023-07/239996.html

版权

Python中最近邻算法实现简介

最近邻算法是一种基于距离度量的分类算法，也是数据挖掘和机器学习领域中常用的算法之一。在Python中，我们可以使用Scikit-learn库中的NearestNeighbors类来实现最近邻算法。

Python中最近邻算法实现简介

NearestNeighbors类可以接受多种距离度量，如欧式距离、曼哈顿距离、闵可夫斯基距离等。默认情况下，NearestNeighbors使用欧式距离来计算最近邻。

接下来，我们来看一个简单的示例，使用NearestNeighbors类来实现最近邻算法。

首先，我们需要导入必要的库：


from sklearn.neighbors import NearestNeighbors

import numpy as np

接着，我们可以定义一些样本数据。这里我们使用一个二维数组来表示样本，每一行表示一个样本，每个样本有两个特征。这个数组可以使用numpy库来创建：

samples = np.array([[1, 2], [3, 4], [5, 6], [7, 8]])

然后，我们可以创建一个NearestNeighbors对象：

nbrs = NearestNeighbors(n_neighbors=2, algorithm='ball_tree').fit(samples)

这里，我们设置n_neighbors为2，表示要找到每个样本的两个最近邻。algorithm参数可以选择ball_tree、kd_tree或brute。这里我们选择ball_tree算法。

现在，我们可以使用kneighbors函数来查找每个样本的最近邻：

distances, indices = nbrs.kneighbors(samples)

kneighbors函数返回两个数组，distances表示每个样本到它的最近邻的距离，indices表示每个样本的最近邻在样本数组中的索引。

最后，我们可以打印出每个样本的最近邻：


for i in range(len(samples)):

print(\Sample\ i, \:\ samples[i], \nNearest neighbors:\ samples[indices[i]])


这样，我们就可以得到类似下面的输出：


Sample 0 : [1 2]

Nearest neighbors: [[3 4]

[1 2]]

Sample 1 : [3 4]

Nearest neighbors: [[1 2]

[3 4]]

Sample 2 : [5 6]

Nearest neighbors: [[7 8]

[5 6]]

Sample 3 : [7 8]

Nearest neighbors: [[5 6]

[7 8]]

总结

NearestNeighbors类是一个非常有用的工具，可以轻松地实现最近邻算法。它具有很好的灵活性，可以适用于多种距离度量和数据类型。在实际应用中，最近邻算法常用于分类、聚类和异常检测等任务。

嗷呜大嘴狼

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python中最近邻算法实现简介

最近邻算法是一种基于距离度量的分类算法，也是数据挖掘和机器学习领域中常用的算法之一。在Python中，我们可以使用Scikit-learn库中的NearestNeighbors类来实现最近邻算法。这里，我们设置n_neighbors为2，表示要找到每个样本的两个最近邻。kneighbors函数返回两个数组，distances表示每个样本到它的最近邻的距离，indices表示每个样本的最近邻在样本数组中的索引。接下来，我们来看一个简单的示例，使用NearestNeighbors类来实现最近邻算法。
复制链接

扫一扫