机器学习相关算法介绍

最新推荐文章于 2024-03-16 03:45:00 发布

菜鸟hang小芒

最新推荐文章于 2024-03-16 03:45:00 发布

阅读量187

点赞数 1

文章标签：机器学习算法数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Hxmang/article/details/114701553

版权

机器学习算法

本文只是自己在学习KNN算法的时候的一些总结，也相当于笔记，自己在遗忘的时候方便来温习回顾，同时也希望能够让看到这篇文章的同学也能够多多少少有些收获嘻嘻。

KNN(K近邻算法)
KNN最简单的分类算法之一，指导思想：“近朱者赤，近墨者黑”。它属于有监督学习的分类算法。
有监督学习：用给定的训练数据集去学习一个新函数(模型)，当输入一个新的数据时可以根据这个新函数去判定其类别。也就是说，有监督学习是已知样本数据集的特点的。
无监督学习：对输入的数据集的样本属性不知，无法预先知道样本的标签。

计算方法原理介绍

KNN算法：
1.首先计算距离，也就是所要求的点与其他已知点之间的距离是多少来判断它的所属类别(计算距离通常选用欧几里得距离或者是马氏距离)
2.根据所求出点与点之间的距离来进行排序(可以升序排序)距离最近的排前面，距离最远的排后面
3.取前K个，比如取前6个，前7个等等
4.加权求平均。比如前两个它距离我很近，那么我就应该给它比较大的权重，而虽然排在前几个，但是离我的距离相对较远，所以我给它相对较小的权重比较合适。

K的选取

首先K值如果取得太大就会出现分类比较模糊；
K值取的太小就会受个例影响，波动比较大。
选取方法：
（1）靠经验，改变K值，测试结果并对比
（2）均方根误差

实例：

样本数据选取的是癌症检测的部分数据来进行测试
这是部分癌症患者数据

菜鸟hang小芒

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。