机器学习02-KNN算法（python）

橙子小哥的代码世界

已于 2024-09-06 19:37:19 修改

阅读量130

点赞数 1

文章标签：算法

于 2024-09-05 10:39:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41645791/article/details/141917550

版权

Knn: k-近领算法：K 是个数，由算法工程师设计，NN 是邻居，近邻就是距离的意思，而平面的两点距离就是欧式距离。

比如说，你最近的3个邻居的距离。那么k 就是3，NN就是这最近3个邻居。距离算的是欧式距离

k: 是算法工程师设计的，所以叫做超参数，调参，就是调的超参数。

分类的时候：判断最近K 个最近样本的类别

回归的时候：判断最近K个最近样本目标的平均值

K的建议：不建议用偶数，不建议超过7，不建议是类别个数的倍数。

特征处理

在该数据中，体重，和身高，视力大小相差太大了，就会导致，学习的时候，体重权重过大，导致没有学习到身高和视力的东西

归一化：指的是把数据分布到0-1

把数据转成标准正态分布

标准差决定胖瘦即分布的幅度。均值决定横坐标数值，当平均值为0，并且标准差为1的时候，就是正态分布。

ps: 数据归一化的时候，容易受异常点的影响，所以通常不会使用（除了图片这种标准化的时候只会存在0-255）

案例：利用KNN算法进行分类：

先把花朵，转成特征向量：花瓣长度，花瓣宽度，花蕊长度，花蕊宽度。

由于不是图片，而是计算数据，所以不是选择归一化，而是选择标准化。

橙子小哥的代码世界

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。