KNN算法

最新推荐文章于 2024-07-12 18:56:03 发布

weixin_62209973

最新推荐文章于 2024-07-12 18:56:03 发布

阅读量24

点赞数

文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_62209973/article/details/133705220

版权

一、KNN算法是什么？

KNN算法是一种基本的机器学习算法，用于分类和回归任务。它是一种无参数学习算法，也被称为懒惰学习算法，因为它不会从训练数据中显式地学习模型参数。在KNN算法中，通过将新的输入样本与训练样本进行相似度度量，来进行分类或回归预测。

二、KNN算法基本工作原理

通过选择最近邻居的多数类别（分类任务）或平均值（回归任务）来对待预测样本进行分类或回归。

三、KNN算法基本步骤

对于分类任务：

计算训练集中每个样本与待预测样本之间的距离或相似度。
根据距离或相似度的大小，选择K个最近邻的训练样本。
统计这K个最近邻样本中出现最频繁的类别作为待预测样本的类别。

对于回归任务：

计算训练集中每个样本与待预测样本之间的距离或相似度。
根据距离或相似度的大小，选择K个最近邻的训练样本。
使用K个最近邻样本的输出值的平均值作为待预测样本的输出值。

四、KNN算法k值选取

1.当训练数据集较小时：

选择较小的K值可以减少噪声的影响，但也容易受到局部特征的干扰。

2.当训练数据集较大时：

选择较大的K值可以使决策边界更加平滑，但可能会导致错分类的概率增加

五、KNN算法实践

使用KNN算法预测一个人是否得癌症并输出此结论正确的概率

1.代码和实现思路：

使用csv包读取名为"Prostate_Cancer.csv"的数据文件，将其转换为字典格式存储在datas列表中。

使用random.shuffle函数打乱datas列表的顺序。

根据留一法将datas列表划分为训练集train_set和测试集test_set

定义了计算欧氏距离的distance函数，用于计算两个数据点之间的距离，并设置K值为5

定义一个knn函数，用于进行KNN分类：

在函数内部，遍历训练集train_set中的每个数据点，并计算其与输入数据点之间的距离。将计算的结果以字典的形式存储在res列表中，包括训练数据点的分类结果和与输入数据点的距离。使用sorted函数对res列表按照距离进行排序。取出前K个距离最小的数据点。对K个数据点进行加权平均，根据权重大小得出最终的分类结果。

定义correct变量并初始化为0，用于记录分类准确的样本数量。遍历测试集test_set中的每个数据点，分别计算其真实分类结果和KNN分类结果，并统计分类准确的样本数量。

2.运行结果

输出结果中：B为良性（无癌症），M为恶性（有癌症）

数据集：

weixin_62209973

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
KNN算法

在函数内部，遍历训练集train_set中的每个数据点，并计算其与输入数据点之间的距离。将计算的结果以字典的形式存储在res列表中，包括训练数据点的分类结果和与输入数据点的距离。在KNN算法中，通过将新的输入样本与训练样本进行相似度度量，来进行分类或回归预测。遍历测试集test_set中的每个数据点，分别计算其真实分类结果和KNN分类结果，并统计分类准确的样本数量。定义了计算欧氏距离的distance函数，用于计算两个数据点之间的距离，并设置K值为5。输出结果中：B为良性（无癌症），M为恶性（有癌症）
复制链接

扫一扫

weixin_62209973 CSDN认证博客专家 CSDN认证企业博客

码龄3年

8: 原创

148万+: 周排名

19万+: 总排名

4036: 访问

: 等级

162: 积分

56: 粉丝

72: 获赞

3: 评论

70: 收藏

私信

关注

热门文章

最新评论

机器学习——PCA主成分分析
CSDN-Ada助手: 恭喜你写了这篇关于PCA主成分分析的博客！你对机器学习领域的深入研究让我感到非常佩服。接下来，我建议你可以尝试写一些实际应用案例，让读者更好地理解PCA在实际问题中的应用。希望你能继续坚持创作，期待你更多的精彩内容！
朴素贝叶斯分类
CSDN-Ada助手: 恭喜您写了第5篇博客！朴素贝叶斯分类是一个很有趣的话题，我对您的深入探讨印象深刻。接下来，我建议您可以尝试将朴素贝叶斯分类与其他机器学习算法进行比较，或者分享一些实际案例来展示其应用。期待您更多的精彩内容！
KNN算法
CSDN-Ada助手: 恭喜你开始博客创作！标题为“KNN算法”的博客很有潜力。KNN算法是机器学习领域中的经典算法之一，你选择这个主题是很不错的，因为它是理解机器学习的入门基石之一。接下来，我建议你可以结合实际案例，详细介绍KNN算法的原理和应用场景，以及与其他算法的对比。期待你在下一篇博客中的更深入探讨！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。