机器学习笔记：KNN

VIP文章 rrrrrz

于 2018-07-11 22:03:00 发布

阅读量244

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35693580/article/details/81007697

版权

KNN

1 简介

K最近邻(k-Nearest Neighbor，KNN)分类算法，是一个理论上比较成熟的方法，也是最简单的机器学习算法之一。该方法的思路是：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。

2 原理及代码

2.1 关于机器学习

首先，机器学习的英文名称叫Machine Learning，简称ML，该领域主要研究的是如何使计算机能够模拟人类的学习行为从而获得新的知识和技能，并且重新组织已学习到的知识和和技能，使之在应用中能够不断完善自身的缺陷与不足。
简单来说，机器学习就是让计算机从大量的数据中学习到相关的规律和逻辑，然后利用学习来的规律来预测以后的未知事物。

2.2 机器学习之学习方法

机器学习分为监督学习，无监督学习，半监督学习（强化学习）等。我们的《机器学习实战》中主要介绍监督学习和无监督学习两种。
监督学习是指：从给定的训练数据集中学习出一个函数（模型参数），当新的数据到来时，可以根据这个函数预测结果。监督学习的训练集要求包括输入输出，也可以说是特征和目标。训练集中的目标是由人标注的。
监督学习最常见的就是回归分析和统计分类，我们这次的KNN就是分类算法之一。

无监督学习

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习笔记：KNN

KNN1 简介 K最近邻(k-Nearest Neighbor，KNN)分类算法，是一个理论上比较成熟的方法，也是最简单的机器学习算法之一。该方法的思路是：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。2 原理及代码2.1 关于机器学习首先，机器学习的英文名称叫Machine Lear...
复制链接

扫一扫

专栏目录

rrrrrz CSDN认证博客专家 CSDN认证企业博客

码龄8年

10: 原创

121万+: 周排名

196万+: 总排名

4925: 访问

: 等级

167: 积分

2: 粉丝

0: 获赞

15: 评论

7: 收藏

私信

关注

热门文章

分类专栏

机器学习 10篇

最新评论

学习笔记：线性回归
「已注销」: 博主写得很不错，分享是一种美德。大大的赞！加油。也希望博主坚持写下去。
关于Kaggle-Titanic: Machine Learning from Disaster的机器学习报告（初稿）
奋斗吧小妮: 博主选取机器学习经典Titanic数据集进行分析，并利用决策树算法进行分类。在数据可视化阶段，作者的可视化结果让人一目了然，也能够支撑接下来的分析过程；作者在众多特征之中选择较为重要的几个特征进行分析，利用决策树算法，结果呈现较好，也符合人们的客观认知。接下来，博主可以继续结合Titanic数据集进行更多算法的练习，以比较不同算法解决该问题的优劣。
机器学习学习笔记：K均值算法
taichitaichi: 本文先介绍了什么是聚类算法，并给了k-means聚类算法的原理和代码，小白很容易复现，是个不错的参考资料。最后博主总结了k-means算法优缺点，阐述自己进行k-means算法实现的体会。建议博主使用其他的数据集进行k-means算法的实现，看能不能得出一些有趣的结果。
关于Kaggle-Titanic: Machine Learning from Disaster的机器学习报告（初稿）
AmbiRF: 这篇文章从泰坦尼克数据集入手，循序渐进的带领着读者进行机器学习探索。首先是对于所有数据集的处理，如此一个庞大的数据集，如果不对所有的数据进行处理的话，带给计算机的负担也太大了，同时分类的效果也不会太好。对于数据的预处理过后，就会对特征的好坏有一定的直观感触。我非常喜欢作者的数据可视化，令人一目了然。后边对于决策树的选用，作者认为的进行了剪枝，预测结果还不错。希望作者能用除了决策树之外的方法再进行尝试一下，说不定会有意想不到的收获。谢谢坐着的分享。
关于Kaggle-Titanic: Machine Learning from Disaster的机器学习报告（初稿）
量子编程永无bug: 全文结构完整，内容丰富；行云流水，深入浅出地探索了传说中的泰坦尼克号。首先进行的是数据的预处理，进行了数据的可视化，让人清楚地看出有关数据量之间的关系。同时可以对数据就有一些直观的感受，在分析完数据后，选取关系大的五项，要做的就是用这五项数据训练分类器。使用的是决策树进行分类，决策树很好的总结了数据中的规律，并以一种简单的形式表现在了我们面前，这其中有一些有趣或者有深意的规律。运行的结果还是比较良好的，也有提高的空间。在这里，如果进行剪枝，或者进行的是CART决策树，效果会不会更好呢？这个有待去探索。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。