统计学习方法(李航) k近邻附python及sklearn实现

最新推荐文章于 2024-01-24 22:16:36 发布

tsuiraku

最新推荐文章于 2024-01-24 22:16:36 发布

阅读量216

点赞数

分类专栏：机器学习文章标签： knn 李航统计学习方法 k近邻

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_49337600/article/details/107926154

版权

本文介绍了k近邻(kNN)算法的基本概念、工作流程，包括模型、距离度量、k值选择及其影响，以及分类决策规则。通过一个乳腺癌诊断的例子展示了kNN的应用，并提供了Python实现kNN分类器的简单示例。

摘要由CSDN通过智能技术生成

k近邻

有监督学习
分类问题

什么是k近邻法？

$k-nearest\space neighbor,k-NN$

这里我们讨论分类问题中的 $k n n$ 算法

相信大家都听过：“近朱者赤，近墨者黑”

k近邻算法的原理类似，直观，通俗的来讲，给定一个训练数据集，对于新输入的数据，在训练集合中找到与之最近的 $k$ 个数据样本，统计 $k$ 个数据样本的类型，通过多数表决法则 $(majoroty\space voting\space rule)$ ，获得选票最多的类别即把该输入的数据分到这个类

在这里插入图片描述

上面这张图体现了 $k n n$ 算法的问题所在之处

灰色的点到底是归于红色还是绿色呢？

这取决于 $k$ 的取值

而 $k$ 值的选择会对 $k n n$ 算法的结果产生重大影响

knn的工作流程

1.模型

我们在运用knn算法之前需要确定以下4个部分：

训练集
距离度量
$k$ 值
分类决策规则

一旦以上4个准则确定后，对于每个新输入训练实例 $x_{i}$ ，它所属的类别唯一地确定

2.距离度量

特征空间中两个实例点的距离是两个实例点相似程度的反映！

我们定义 $L_{p}$ 距离：
$L_{p}(x_{i},x_{j})=(\sum_{l=1}^{n}{|x_{i}^{(l)}-x_{j}^{(l)}|^{p}})^{\frac{1}{p}}$

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法(李航) k近邻附python及sklearn实现

k近邻有监督学习分类问题什么是k近邻法？k−nearest neighbor,k−NNk-nearest\space neighbor,k-NNk−nearest neighbor,k−NN这里我们讨论分类问题中的knnknnknn算法相信大家都听过：“近朱者赤，近墨者黑”k近邻算法的原理类似，直观，通俗的来讲，给定一个训练数据集，对于新输入的数据，在训练集合中找到与之最近的kkk个数据样本，统计kkk个数据样本的类型，通过多数表决法则(majoroty vo
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。