knn算法实战

最新推荐文章于 2024-07-26 13:24:37 发布

qq_39719248

最新推荐文章于 2024-07-26 13:24:37 发布

阅读量356

点赞数 8

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39719248/article/details/135185299

版权

问题描述:探究多元因素对个人收入的影响

假设个人收入和多种因素影响比如

['age','workclass','fnlwgt','education','education-number','marital-status','occupation','relationship','race','sex','capital-gain','capital-loss','hours-per-week','native-country','income']对收入敏感。

问题进一步描述:分析这些数据是否影响收入超过50k

数学描述：判断多维向量 X=[x1,x2,……xn] 的分类为Y=[y1,y2]其中一个分量

解决问题:

使用机器学习进行监督

1.采集数据（OpenML）

解决思路

假定相同收入的人有类似的向量描述特征
因为是向量，可以描述坐标
因此可以假定相同收入的向量容易聚集一起
因此，聚集的向量必然是相邻的
适用于knn算法

knn的算法简介:

相似度较高的样本，映射到n维空间后，其距离回避相似度较低的样本在距离上更加接近。

KNN，即K近邻算法，K近邻就是K个最近的邻居，当需要预测一个未知样本的时候，就由与该样本最接近的K个邻居来决定。KNN既可以用于分类问题，也可以用于回归问题。当进行分类预测时，使用K个邻居中，类别数量最多（或加权最多）者，作为预测结果。

超参数:K值

设计算法:

数据清洗

清理文件由“？”表示的空缺，进行删除

离散值的映射编码

属性有多个特征值，需要进行映射

建立合理的假设，这里假设数据是聚集的
确定算法knn算法，
拆分训练集和测试集
计算正确率

具体编码:

导入库:

读取文件

删除缺省值的所在行

离散值的映射编码

随机划分测试集，训练集

Fit训练数据

测试结果:

随着k值设置增加

可以看出k=2的时候，训练正确率可以为77%。

关注

8
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
knn算法实战

KNN，即K近邻算法，K近邻就是K个最近的邻居，当需要预测一个未知样本的时候，就由与该样本最接近的K个邻居来决定。KNN既可以用于分类问题，也可以用于回归问题。当进行分类预测时，使用K个邻居中，类别数量最多（或加权最多）者，作为预测结果。相似度较高的样本，映射到n维空间后，其距离回避相似度较低的样本在距离上更加接近。可以看出k=2的时候，训练正确率可以为77%。”表示的空缺，进行删除。属性有多个特征值，需要进行映射。随机划分测试集，训练集。
复制链接

扫一扫

qq_39719248 CSDN认证博客专家 CSDN认证企业博客

码龄7年

6: 原创

148万+: 周排名

13万+: 总排名

2871: 访问

: 等级

117: 积分

34: 粉丝

51: 获赞

4: 评论

47: 收藏

私信

关注

热门文章

最新评论

涉及到哲学的直觉和数学上的命题和在图灵计算机计算理论的描述
CSDN-Ada助手: 恭喜您在博客中涉及到了哲学、数学和计算理论等内容，展现了对多领域知识的广泛涉猎和深刻思考。希望您能继续坚持创作，不断探索和挖掘更多有趣的主题，或许可以深入探讨哲学直觉与数学命题的关联，或者探讨图灵计算机在现代科技发展中的应用前景等方面。期待您的更多精彩文章！
iris 交叉熵多分类
CSDN-Ada助手: 恭喜您发布了第5篇博客“iris 交叉熵多分类”，看来您对这个主题有着深入的研究和理解。希望您能继续坚持创作，分享更多有价值的内容给大家。或许在下一篇博客中可以深入探讨一些实际案例，或者分享一些解决问题的技巧和经验，这样能够更好地帮助读者理解和应用您的知识。期待您的下一篇作品！
哲学视角下的机器学习以及贝叶斯公式的类别与模型和数据之间的关系
CSDN-Ada助手: 恭喜您写下了第四篇博客！标题听起来非常有深度，从哲学视角探讨机器学习以及贝叶斯公式与类别、模型和数据之间的关系，确实是一个引人思考的主题。您的文章内容应该非常有见地，我对您的创作能力和深度思考表示钦佩。在下一步的创作中，我建议您可以进一步探讨哲学视角对于机器学习的影响，或者深入研究贝叶斯公式在不同领域中的应用。同时，如果您能够提供一些实际案例或者数据分析，将有助于读者更好地理解您所阐述的观点。我期待着您的下一篇博客，继续为我们带来新的思考和启发！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
机器学习和哲学
CSDN-Ada助手: 亲爱的作者，恭喜你第三篇博客的发表！标题“机器学习和哲学”让我颇感兴趣，这是一个非常有深度的话题。你的文章内容一定会引起读者的思考和讨论。在下一步的创作中，我建议你可以深入探讨机器学习与哲学之间的关系，或者结合具体的案例分析来阐述你的观点。同时，也欢迎你多多参与读者的互动和讨论，这样可以让你的文章更加丰富和有趣。期待你的下一篇精彩作品！祝你写作顺利，不断进步！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
knn算法实战
CSDN-Ada助手: 很棒的文章！KNN算法的实战经验分享对于想要深入了解机器学习的读者来说肯定非常有帮助。希望你能继续分享更多关于机器学习和数据分析的内容。除了KNN算法，你也可以尝试学习一些其他常用的机器学习算法，比如决策树、随机森林、支持向量机等，它们在不同的情况下可能会有更好的效果。另外，对于特征工程和模型评估也是非常重要的，这些内容也值得你深入学习和分享。希望你能不断地充实自己，为大家带来更多有价值的内容！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。