分类模型之KNN

KNN算法基于距离进行分类,包括闵可夫斯基距离(如曼哈顿距离和欧式距离)。当面对大量数据时,kd_tree能有效提高搜索效率。通过构建kd_tree,将数据点分割并形成树状结构,快速定位到最近的k个邻居。KNN适用于多样本分类和稀有事件分类,但样本分布不均衡时准确性可能下降。
摘要由CSDN通过智能技术生成

KNN算法的概念比较好理解,简单总结:
1.距离概念
闵可夫斯基距离:在这里插入图片描述
当p =1时,为曼哈顿距离
曼哈顿距离为平面x1点做关于y的垂线,x2做关于x的垂线,取使两点连通部分。d(i,j)=|X1-X2|+|Y1-Y2|
在这里插入图片描述
当p =2时,为欧式距离
欧式距离为点到点的最短距离
在这里插入图片描述
2.kd_tree
如果判断一个点到平面内点的距离:
1。可以选择遍历到所有点的距离
2。可以采用kd_tree
kd_tree思想:
在同一个平面(维度)把所有点尽可能的分成同样数量的两个部分,无线切分,直到不能切分为止。这样以切分的那条线作为索引,把分割线作为中间结点,图中的点作为叶子结点,可以的到一课树状结构。这样,就很容易找到一个点附近的k个点。比如,随机在图中出现一个点,我们可以快速的确定这个点和哪个叶子结点出现在同一个区间,然后来计算新出现的点和叶子结点的距离,以这个距离为半径,可以轻松得到与哪一个中间结点更近,更快的找到附近更近的叶子节点。

KNN算法优

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值