KNN （k近邻算法）代码实现

@ysw

于 2023-11-04 10:26:01 发布

阅读量62

点赞数

文章标签：近邻算法 python 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_57790267/article/details/134215229

版权

# 如有问题，欢迎大家批评指正，谢谢。

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
import matplotlib.pylab as plt


class KNN:
    def __init__(self, k):
        self.k = k

    def fit(self, X, y):
        self.X_train = X
        self.y_train = y

    def euclidean_distance(self, x1, x2):
        return np.sqrt(np.sum((x1 - x2) ** 2))

    def predict(self, X):
        y_pred = [self._predict(x) for x in X]
        return np.array(y_pred)

    def _predict(self, x):
        # 计算测试点与所有训练点的距离
        distances = [self.euclidean_distance(x, x_train) for x_train in self.X_train]
        # 获取距离最近的k个点的索引
        k_indices = np.argsort(distances)[:self.k]
        # 获取k个点的标签
        k_nearest_labels = [self.y_train[i] for i in k_indices]
        # 返回k个点中出现最频繁的标签
        most_common = np.bincount(k_nearest_labels).argmax()
        return most_common


if __name__ == "__main__":
    # 加载Iris数据集
    iris = datasets.load_iris()
    X = iris.data
    y = iris.target

    # 将数据集分为训练集和测试集
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

    # 初始化KNN分类器，指定K值
    knn = KNN(k=3)

    # 训练模型
    knn.fit(X_train, y_train)

    # 在测试集上进行预测
    print("ytest", y_test)
    predictions = knn.predict(X_test)
    acc = 0
    acc += (y_test == predictions).sum().item()
    acc = 100 * acc / X_test.data.shape[0]
    print(f"Accuracy: {acc:.2f}%")

    # 利用matplotlib绘制图像
    plt.figure(figsize=(8, 6))
    plt.scatter(X_train[y_train == 0, 2], X_train[y_train == 0, 3], color='g', label='Class 0')
    plt.scatter(X_train[y_train == 1, 2], X_train[y_train == 1, 3], color='y', label='Class 1')
    plt.scatter(X_train[y_train == 2, 2], X_train[y_train == 2, 3], color='b', label='Class 2')
    plt.scatter(X_test[:, 2], X_test[:, 3], color='r', label='Predict')

    plt.title('Iris Data Visualization')
    plt.xlabel('Petal Length')
    plt.ylabel('Petal Width')
    plt.legend()
    plt.show()

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
KNN （k近邻算法）代码实现

计算测试点与所有训练点的距离。# 返回k个点中出现最频繁的标签。# 获取距离最近的k个点的索引。# 利用matplotlib绘制图像。# 初始化KNN分类器，指定K值。# 将数据集分为训练集和测试集。# 获取k个点的标签。# 加载Iris数据集。# 在测试集上进行预测。
复制链接

扫一扫

@ysw CSDN认证博客专家 CSDN认证企业博客

码龄3年

13: 原创

148万+: 周排名

16万+: 总排名

9806: 访问

: 等级

153: 积分

6: 粉丝

17: 获赞

5: 评论

29: 收藏

私信

关注

热门文章

最新评论

机器学习：L1 约束
CSDN-Ada助手: 恭喜你写了第10篇博客！机器学习的L1约束是一个很有深度的话题，你的文章阐述得很清楚。希望你能继续保持创作的热情，不断探索更多机器学习的知识点。或许下一步可以尝试结合实际案例，例如应用L1约束解决实际问题的情况分析，这样可以让读者更直观地理解L1约束的应用。期待你的下一篇作品！
deepfake detection 基于指纹、基于图像和基于频谱的检测方法
CSDN-Ada助手: 恭喜您撰写了第11篇博客！标题中提到的基于指纹、基于图像和基于频谱的深度伪造检测方法都是当前热门的研究方向。您的博客内容对于那些关注深度伪造技术的读者来说一定非常有价值。如果我有一些建议的话，那就是您可以考虑添加一些实例或案例，以进一步说明这些检测方法的实际应用和效果。这样的补充将使您的博客更加全面，同时也能让读者更好地理解和应用这些方法。期待您的下一篇创作！
机器学习：卷积，反卷积，池化，反池化
CSDN-Ada助手: 恭喜你写了这么一篇有深度的博客！你对机器学习的理解和表达能力令人印象深刻。不过，我想提供一个建议，下一步你可以考虑加入一些实际案例或者应用场景的分析，这样可以让读者更容易理解和接受你的观点。希望看到你更多的作品！
KNN （k近邻算法）代码实现
CSDN-Ada助手: 非常高兴看到您继续创作，恭喜您完成了第5篇博客！标题“KNN（k近邻算法）代码实现”听起来非常有趣。您对KNN算法的实现进行了探索，这对读者来说一定非常有帮助。在下一步的创作中，我建议您可以考虑扩展一下文章的内容，例如介绍KNN算法的应用场景、不同参数取值对算法性能的影响、以及如何对KNN算法进行改进等方面。这样可以进一步丰富读者的知识，并让他们在实际应用中更好地理解和使用KNN算法。感谢您的分享，期待您的下一篇文章！
torch.argmax(outputs, dim=1)与torch.argmax(outputs, dim=0)
CSDN-Ada助手: 恭喜您写了第6篇博客！标题"torch.argmax(outputs, dim=1)与torch.argmax(outputs, dim=0)"看起来非常有趣。您对torch.argmax函数在不同维度上的使用进行了探索，这对于深入理解PyTorch的功能和灵活性非常有帮助。在下一篇博客中，我建议您可以继续深入探讨torch.argmax函数在不同场景下的应用。例如，您可以介绍在计算机视觉任务中，如何使用torch.argmax函数来解析模型的输出结果，或者在自然语言处理任务中如何利用该函数来进行文本分类。这些实际场景的示例将使您的读者更容易理解和应用这个函数。再次恭喜您的持续创作，期待您的下一篇博客！希望我的建议对您有所帮助。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。