人工智能-KNN算法

最新推荐文章于 2024-07-13 15:57:18 发布

wyssailing

最新推荐文章于 2024-07-13 15:57:18 发布

阅读量794

点赞数

分类专栏：人工智能文章标签：人工智能 KNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wyssailing/article/details/100715902

版权

人工智能专栏收录该内容

7 篇文章 5 订阅

订阅专栏

KNN算法在识别算法中属于相对比较简单的。举个例子就好理解。如果有九个人，手里分别拿着写有1到9数字的卡片。
比如第一个人拿着数字1，第二个人拿着数字2，以此类推，第九个人拿着数字9。好了，现在规定拿着数字1到3的三个人为红队，4到6的为黄队，7到9的为蓝队。

现在又来了一个人，他拿着1到9中随机的一个数。那么他应该分到哪个队呢？那位要说了，那还不好分，属于哪段区间就分到哪个队好了。

话是这样说，可对于机器就有点难度了，而且有时数据各种各样还很多，我们做不到一一分类。有时还出乎我们的意料，比如这个来的人傻叉，拿错卡片了，拿个写着10的卡片过来了。那机器不就不会玩了吗！

这时KNN算法就起作用了，它是这样规定的:比较新来的人拿的数字和这些人拿的数字的差值(也就是距离)，然后取差值最小的前K个人。就是看这个人拿的数字和这九个人中哪K个人最接近。在这K个人中多数分到了哪个队，他就分到哪个队了。

比如K取3，新来这个人拿数字4，在这1到9的数字中，取前3个和数字4最接近的，分别是:4、5、3。这三个数中4、5分到了黄队，只有3分到了红队。那么新来的就分到黄队。同上，如果这个人拿着卡片是数字10，当然分到蓝队了。

好了，我们规范化的把这个算法写出来:
对未知类别属性的数据集的每个点依次执行以下操作:
1.计算已知类别的数据集中的点与当前点之间的距离。
2.按照距离递增次序排序。
3.选取与当前点距离最小的k个点。
4.确定前k个点所在类别的出现频率。
5.返回前k个点所出现频率最高的类别作为当前点的预测分类。

一般情况数据集中的点都是用特征向量表示的，特征向量一般是多维的。那么点与点之间的距离就要求向量间的欧式距离了。欧式距离的计算如下：

两个n维相量和间的欧式距离为：

更多内容请关注微信公众号：IT职场说

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
人工智能-KNN算法

KNN算法在识别算法中属于相对比较简单的。举个例子就好理解。如果有九个人，手里分别拿着写有1到9数字的卡片。比如第一个人拿着数字1，第二个人拿着数字2，以此类推，第九个人拿着数字9。好了，现在规定拿着数字1到3的三个人为红队，4到6的为黄队，7到9的为蓝队。现在又来了一个人，他拿着1到9中随机的一个数。那么他应该分到哪个队呢？那位要说了，那还不好分，属于哪段区间就分到哪个队好了。话是这样...
复制链接

扫一扫

专栏目录

wyssailing CSDN认证博客专家 CSDN认证企业博客

码龄15年

129: 原创

4万+: 周排名

7万+: 总排名

16万+: 访问

: 等级

1911: 积分

108: 粉丝

109: 获赞

31: 评论

509: 收藏

私信

关注

热门文章

分类专栏

无人机 85篇
读书笔记 6篇
人工智能 7篇
笔记 6篇
电路分析 2篇
综合 17篇
嵌入式 3篇
程序设计模式 1篇
c++ 2篇
tensorflow 1篇

最新评论

无人机项目跟踪详解七十——升压电路及LM27313详解
lvvvvip: 电容发烫怎么办
无人机项目跟踪记录六十一-----电源升压模块
lvvvvip: 电容发热怎么办
Python中归一化特征到一定区间的函数——MinMaxScaler()
柏田尼乐: .transform() 是在已经进行拟合的情况下，直接将变换应用于数据集；.fit_transform() 是将 .fit() 和 .transform() 这两个步骤结合在一起，首先使用 .fit() 方法对数据进行拟合（如计算均值、方差等），然后应用这些转换到数据上数据集上。在第11行后面加上以下几行代码 x_test_maxabs2 = min_max_scaler.fit(x) x_test_maxabs21 = x_test_maxabs2.transform(x) print('x_test_maxabs21 = \n',x_test_maxabs21) x_test_maxabs21和x_minmax的输出是相等的
Python中归一化特征到一定区间的函数——MinMaxScaler()
柏田尼乐: MinMaxScaler 是 scikit-learn 中的一个数据预处理工具，用于将数据特征缩放到给定的最小值和最大值范围内。参数 feature_range=(0, 1) 定义了数据特征的缩放范围，即将数据特征缩放到 [0, 1] 这个区间内。如果 copy 被设置为 True，那么原始数组不会随着副本的改变而改变。MinMaxScaler 会创建一个数据的副本，对副本进行缩放转换，并且返回缩放后的副本，而不影响原始数据。如果 copy 参数设为 False，则会直接在原始数据上进行转换。这意味着，在调用 MinMaxScaler 的 fit_transform ()方法时，会直接修改原始数据而不是创建一个新的缩放后的副本。
Python中归一化特征到一定区间的函数——MinMaxScaler()
柏田尼乐: 元组（tuple）是 Python 中的数据结构，类似于列表，但是元组是不可变的，意味着一旦创建就无法更改其内容。元组用圆括号 () 表示，元素之间使用逗号分隔。与列表不同，元组的内容不可修改，因此适合用于表示不可更改的数据集合。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

wyssailing 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。