李航统计学习方法-K邻近法

最新推荐文章于 2020-12-02 15:56:57 发布

Aloe_vera_Al

最新推荐文章于 2020-12-02 15:56:57 发布

阅读量424

点赞数

分类专栏：机器学习文章标签：李航统计学习机器学习

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

k邻近简单的理解一下就是，给定一部分带标签样本和一个未知标签样本，将未知标签样本和带标签样本一一比较求距离，然后根据最近k个样本来决定未知标签样本的类别。
这里写图片描述
如上图：确定圆圈的类别，如K=3，则为三角；若K=5，则为正方形。

那么怎么求距离？选择何种求距离算法。
书中给出了Lp距离的求解：
这里写图片描述

除了距离度量外，K邻近法的K值如何选取也很重要，书中介绍如下：
这里写图片描述

K值较小，模型较复杂，易过拟合；K值较大，模型简单。

按照开始我说了，用未知样本和已知样本一一对比方法，在样本数很大时，会花费很多很多时间，有没有一种策略，来加速这种对比呢：下面就要将书中提到的KD树。
构建平衡KD树：
这里写图片描述

KD树搜索：
这里写图片描述

除了KD树这种方式还有其他的加速方式：先要详细了解的见：
http://www.cnblogs.com/v-July-v/archive/2012/11/20/3125419.html
上述链接详细讲解了knn算法中的距离度量和k邻近优化方法。
理论永远都在纸上，怎么用才是关键，python代码链接奉上：
http://blog.csdn.net/wds2006sdo/article/details/51933044

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Aloe_vera_Al CSDN认证博客专家 CSDN认证企业博客

码龄8年

1: 原创

211万+: 周排名

209万+: 总排名

3万+: 访问

: 等级

309: 积分

9: 粉丝

8: 获赞

4: 评论

14: 收藏

私信

关注

热门文章

分类专栏

CNN 2篇
tensorflow 3篇
目标检测 3篇
机器学习 4篇
python 1篇

最新评论

CNN数据增强(1)
一只hijack: 请问在使用PCA方法时出现问题，TypeError:'float' object cannot be interpreted as an integer，这是什么原因呢？图片的问题吗？
YOLO（You Only Look Once）--只需瞄一眼
Teng-Sun: 每个格子输出B个bounding box 请问训练的时候，这B个bounding box初始化的时候是随机取得吗？
TFRecord格式数据和类似cifar的bin格式文件
qq_20932987: image_list =list(temp[:,0]) IndexError: too many indices for array出现这种错误是什么原因呢代码是一样的
TFRecord格式数据和类似cifar的bin格式文件
Tourior: 666

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。