机器学习之路——K邻近法详解

最新推荐文章于 2024-04-26 15:03:57 发布

leon710

最新推荐文章于 2024-04-26 15:03:57 发布

阅读量3.8k

点赞数 2

分类专栏：读书笔记文章标签：机器学习 KNN Kd树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baidu_36881343/article/details/79745387

版权

统计学习方法第三章——knn算法

首先要明确的第一个重点是，k邻近不具有显示的学习过程，它是基于实例的一种学习方法，简单来说就是给定一堆西瓜的数据，然后输入一个新西瓜的数据，找到与这个新西瓜最近的k个西瓜，这k个西瓜如果大多数是属于又甜又好吃的西瓜，那么就把这个西瓜分为又甜又好吃的西瓜这一类的西瓜中。

从上述的描述中不难看出，有三个要注意的一个是K值，也就是周围有几个西瓜和新西瓜相邻，如果k太小，那么好处是近似误差会减小，只有特征与这几个西瓜相似的才对预测新西瓜的“甜”“好吃”起作用，但是相同的，会带来一个问题，就是假如在这几个西瓜中不甜的多，那么会带来估计误差，这也就是k值减小使得模型变的复杂，复杂度上升，容易发生过拟合。k太大也就容易理解了，如下图

二是距离的度量，一般采用欧式距离，但也有不同的距离度量可供选择，不同的距离所确定的最近邻点不同。

1:a）

(1)曼哈顿距离：

(2)欧几里得距离：

(3)切比雪夫距离：

(4)闵可夫斯基距离：

(5)马氏(Mahalanobis)距离：

三是分类决策规则的不同，往往采用的策略是多数表决策略，如果采用的是多数表决策那么，我们可以进行如下推导：

接下来就是实践。我们来看一下不同的k值不同的分类决策对性能有什么影响。

对于经典的IRIS数据集我进行了如下实验

matlab代码如下：

最低0.47元/天解锁文章

关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
机器学习之路——K邻近法详解

统计学习方法第三章——knn算法首先要明确的第一个重点是，k邻近不具有显示的学习过程，它是基于实例的一种学习方法，简单来说就是给定一堆西瓜的数据，然后输入一个新西瓜的数据，找到与这个新西瓜最近的k个西瓜，这k个西瓜如果大多数是属于又甜又好吃的西瓜，那么就把这个西瓜分为又甜又好吃的西瓜这一类的西瓜中。从上述的描述中不难看出，有三个要注意的一个是K值，也就是周围有几个西瓜和新西瓜相邻，如果k太小，那么...
复制链接

扫一扫

专栏目录

leon710 CSDN认证博客专家 CSDN认证企业博客

码龄8年

2: 原创

76万+: 周排名

40万+: 总排名

6253: 访问

: 等级

86: 积分

6: 粉丝

3: 获赞

1: 评论

14: 收藏

私信

关注

分类专栏

读书笔记 2篇

最新评论

机器学习之路——《统计学习方法》（一）
不动心、: 我感觉是t=Ne代入后N就从分子到分母了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

机器学习之路——《统计学习方法》（一）

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。