K近邻算法：让西瓜帮你找邻居！

A宝呀

于 2025-04-09 21:59:46 发布

阅读量877

点赞数 10

文章标签：机器学习人工智能算法 k近邻算法学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73254888/article/details/147103758

版权

目录

一、KNN是什么？——西瓜小区的投票大会 🏘️

二、三大关键问题 🔑

1. K值怎么选？——邻居要几家？🤔

2. 怎么算距离？——邻居有多近？📏

3. 要不要加权？——邻居话语权不同 ⚖️

三、西瓜摊实战演示 🍉

四、KNN的优缺点 ⚖️

五、Python实战——4行代码找邻居 🐍

六、生活处处有KNN 🌍

七、趣味实验：班级里的KNN 👩🎓👨🎓

八、总结：KNN核心口诀 📚

🍉👫 K近邻算法：让西瓜帮你找邻居！

大家好呀！今天我要介绍一个超直观的算法——K近邻(KNN)，它就像住在水果小区里的热心西瓜大妈，总是根据"邻居们"的情况来帮你做决定！准备好用西瓜认识这个有趣的算法了吗？😄

一、KNN是什么？——西瓜小区的投票大会 🏘️

想象你搬进了一个"西瓜小区"，这里的每户人家都贴着标签：

🟢 甜西瓜家庭
🔴 不甜西瓜家庭

现在来了个新西瓜（问号户），要判断它甜不甜，KNN是这样做的：

数最近的K户邻居（比如K=3）
看邻居们的标签
少数服从多数投票！

💡 专业解释：KNN通过测量新数据点与训练数据的距离，找到最近的K个邻居，用它们的类别进行多数表决。

二、三大关键问题 🔑

1. K值怎么选？——邻居要几家？🤔

K=1：只听最近一家的意见 → 容易误判 ❌
(就像只听最八卦的王大妈的话)
K=10：问整个小区的意见 → 反应迟钝 🐢
(就像开全体业主大会)
黄金法则：通常取总样本数的平方根，比如100个西瓜就选K=10

2. 怎么算距离？——邻居有多近？📏

常用距离公式：

直线距离（欧氏距离）：√[(x₁-x₂)² + (y₁-y₂)²]
(就像用卷尺直线测量)
街区距离（曼哈顿距离）：|x₁-x₂| + |y₁-y₂|
(就像在城市里拐直角走路)
余弦相似度：看特征向量的角度 📐
(不看距离看方向)

3. 要不要加权？——邻居话语权不同 ⚖️

基本版：每家一票
进阶版：离得越近投票权重越大
(就像住对门的张阿姨比小区那头的李大爷说话更有参考价值)

三、西瓜摊实战演示 🍉

假设我们有6个已知西瓜的数据：

西瓜	糖度	重量(kg)	甜度
A	12	4.2	甜
B	11	5.1	不甜
C	13	4.8	甜
D	10	5.5	不甜
E	12.5	4.5	甜
F	9	6.0	不甜

新西瓜：糖度11.5，重量5.0kg，甜不甜？

步骤：

计算与各西瓜的距离（用欧氏距离）：

- 与A的距离：√[(11.5-12)² + (5.0-4.2)²] ≈ 0.94
- 与B的距离：√[(11.5-11)² + (5.0-5.1)²] ≈ 0.51
- ...（其他类似计算）

按距离排序找出最近3个（K=3）：

- 第1近：B（不甜，距离0.51）
- 第2近：E（甜，距离0.71）
- 第3近：A（甜，距离0.94）

投票结果：2甜 vs 1不甜 → 判定为甜西瓜！

四、KNN的优缺点 ⚖️

👍 优点：

简单易懂：幼儿园小朋友都能理解 👶
无需训练：来新数据直接计算（懒人福音 😴）
适应性强：能处理多分类问题

👎 缺点：

计算量大：每次预测都要算所有距离 🐢
特征要缩放：比如糖度(10-13)和重量(4-6kg)单位不同要标准化
维度灾难：特征太多时距离计算会失效 🚨

五、Python实战——4行代码找邻居 🐍

from sklearn.neighbors import KNeighborsClassifier

# 准备数据（特征：糖度，重量；标签：0不甜/1甜）
X = [[12,4.2], [11,5.1], [13,4.8], [10,5.5], [12.5,4.5], [9,6.0]]
y = [1, 0, 1, 0, 1, 0]

# 创建KNN模型（K=3）
西瓜大妈 = KNeighborsClassifier(n_neighbors=3).fit(X,y)

# 预测新西瓜
print(西瓜大妈.predict([[11.5,5.0]]))  # 输出[1]表示甜！

六、生活处处有KNN 🌍

电影推荐 🎬→❤️
"喜欢《星际穿越》的人也喜欢《盗梦空间》"
信用评估 💳→📉
"和你有相似消费习惯的人多数违约了"
疾病诊断 🤒→🩺
"症状相似的病人80%是流感"
西瓜摊定价 🍉→💰
"和这批甜瓜最像的上一批卖10元/斤"

七、趣味实验：班级里的KNN 👩🎓👨🎓

在教室里玩这个游戏：

每位同学写下：身高 + 是否喜欢篮球
新同学加入时，找出物理距离最近的K个同学
根据这些同学是否喜欢篮球来预测新同学

(这就是真人版KNN！)

八、总结：KNN核心口诀 📚

找邻居：计算距离找最近的K个
听意见：邻居们投票决定
调参数：K值和距离度量很关键

公式虽然简单但很强大：
ŷ = mode{yᵢ | (xᵢ,yᵢ) ∈ Nₖ(x)}
（ŷ是新数据的预测结果，mode是众数，Nₖ(x)是x的K个最近邻）

🍉 互动时间 🍉
你能想到生活中哪些KNN的应用场景？
是找相似品味的歌友？还是找学习水平相当的同学组队？
快来评论区分享你的"邻居故事"！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。