KNN算法对糖尿病数据分类

南柯Sdream

于 2023-10-09 20:39:45 发布

阅读量395

点赞数

文章标签：算法分类数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_63698246/article/details/133714999

版权

一、简介

K近邻算法（K-Nearest Neighbors，简称KNN）是一种用于分类和回归的统计方法。KNN 可以说是最简单的分类算法之一，同时，它也是最常用的分类算法之一。

1.1原理

KNN算法是选择与输入样本在特征空间内最近邻的k个训练样本并根据一定的决策规则，给出输出结果。

决策规则：

分类任务：输出结果为k个训练样本中占大多数的类。

回归任务：输出结果为k个训练样本值的平均值。

如下图的分类任务，输出结果为w1类。

1.2 距离计算

KNN算法的一个关键问题，就是如何判断距离最近。常用欧氏距离计算：

在二维空间中，公式为：

n维空间中，公式为：

二、步骤

（1）计算已知类别数据集中的点与当前点之间的距离；

（2）按照距离递增次序排序；

(3) 选取与当前点距离最小的k个点；

(4) 确定前k个点所在类别的出现频率；

(5) 返回前k个点出现频率最高的类别作为当前点的预测类别。

三、代码实现

使用KNN算法对糖尿病数据集进行分类

1、导入所需的库

2、准备数据集，将其划分为训练集和测试集

3、创建KNN分类器对象，并进行训练

4、对测试集数据进行预测

5、运行结果为

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
KNN算法对糖尿病数据分类

K近邻算法（K-Nearest Neighbors，简称KNN）是一种用于分类和回归的统计方法。KNN 可以说是最简单的分类算法之一，同时，它也是最常用的分类算法之一。KNN算法是选择与输入样本在特征空间内最近邻的k个训练样本并根据一定的决策规则，给出输出结果。(5) 返回前k个点出现频率最高的类别作为当前点的预测类别。分类任务：输出结果为k个训练样本中占大多数的类。（1）计算已知类别数据集中的点与当前点之间的距离；回归任务：输出结果为k个训练样本值的平均值。(3) 选取与当前点距离最小的k个点；
复制链接

扫一扫

南柯Sdream CSDN认证博客专家 CSDN认证企业博客

码龄3年

8: 原创

150万+: 周排名

25万+: 总排名

2958: 访问

: 等级

105: 积分

19: 粉丝

24: 获赞

4: 评论

32: 收藏

私信

关注

热门文章

最新评论

机器学习环境搭建
CSDN-Ada助手: 恭喜您开始博客创作！标题《机器学习环境搭建》听起来非常有趣，对于想要入门机器学习的读者来说，这是一个很好的起点。在这篇博客中，您可以分享一些关于搭建机器学习环境的经验和技巧，这对于那些想要开始学习机器学习的人们来说将会非常有帮助。接下来，我建议您可以考虑介绍一些常用的机器学习工具和框架，并分享一些实践案例，这样读者们可以更好地理解和应用所学知识。希望您在接下来的创作中继续保持谦虚的态度，让读者们感受到您的用心与热情。期待您的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
KNN算法对糖尿病数据分类
机智小常: 请问可以发一下源码吗，谢谢！
机器学习：支持向量机（SVM）
CSDN-Ada助手: 恭喜你写了这么一篇精彩的博客！机器学习领域的知识对很多人来说都是一种挑战，但你用简洁清晰的语言把SVM算法讲得很透彻。希望你能继续分享更多关于机器学习的知识，也许可以考虑深度学习或者神经网络的主题，这些都是当前热门的研究方向。加油！
机器学习：朴素贝叶斯
CSDN-Ada助手: 恭喜你写了这么精彩的博客！对朴素贝叶斯算法的介绍让我受益匪浅。希望你能继续分享你的机器学习见解，也许下一篇可以介绍一下其他常用的分类算法，比如决策树或支持向量机等。期待你的下一篇作品！
机器学习基于Python绘制PR曲线和ROC曲线
CSDN-Ada助手: 恭喜您写了第三篇博客！标题看起来很有吸引力，我对PR曲线和ROC曲线在机器学习中的应用非常感兴趣。您的博客内容一定非常有深度和实用价值。希望您能继续保持创作的热情，分享更多有关Python和机器学习的知识。如果可以的话，我期待您能探讨一下如何在实际项目中优化PR曲线和ROC曲线的应用，或是介绍一些应对实际挑战的技巧。谢谢您的辛勤付出，期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。