机器学习笔记十-- 由kNN引入维度灾难并进行降维改善

最新推荐文章于 2023-08-05 22:24:44 发布

Womeng_qin

最新推荐文章于 2023-08-05 22:24:44 发布

阅读量1.6k

点赞数

分类专栏：机器学习文章标签：机器学习算法

本文链接：https://blog.csdn.net/weixin_44546905/article/details/106432227

版权

本文探讨了k近邻（kNN）算法，包括其工作原理、超参数k的选择以及在高维空间中的挑战——维度灾难。分析了在高维空间中满足密采样条件所需的大量样本，指出这在实际中难以实现。为解决这一问题，文章介绍了降维方法，如特征选择和降维技术，以提高样本密度和简化距离计算，从而改善学习效果。

摘要由CSDN通过智能技术生成

专业词汇

k 近邻(k-Nearest Neighbor）
密采样" (dense sample)
维数灾难 (curse of dimensionality）
降维(dimension red uction)
"子空间" (subspace)
"多维缩放" (Multiple Dimensional Scaling）

kNN

k近邻学习概述

超参数：k的选则
监督学习方法
给定测试样本–>(基于某种距离度量)最靠近这个样本的 k 个训练样本，然后基于这 k 个"邻居"的信息来进行预测
分类任务中可使用"投票法"
回归任务中时使用"平均法"
基于距离远近进行加权平均或加权投票

假设1：样本独立同分布
假设2：任意测试样本 a 附近任意小的距离范围内总能找到一个训练样本，训练样本的来样密度足够大（密采样）（这个假设怎么做到呢？：归一化！）

它是一种懒惰学习，此类学习技术在训练阶段仅仅是把样本保存起来，训练时间开销为零，待收到测试样本后再进行处理
之前的算法，那些在训练阶段就对样本进行学习处理的方法，称为急切学习

研究完贝叶斯分类器再回来分析kNN的错误率

kNN算法第二个假设实现的讨论

最低0.47元/天解锁文章

Womeng_qin

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
机器学习笔记十-- 由kNN引入维度灾难并进行降维改善

专业词汇k 近邻(k-Nearest Neighbor）密采样" (dense sample)维数灾难 (curse of dimensionality）降维(dimension red uction)"子空间" (subspace)"多维缩放" (Multiple Dimensional Scaling）kNNk近邻学习概述超参数：k的选则监督学习方法给定测试样本–>(基于某种距离度量)最靠近这个样本的 k 个训练样本，然后基于这 k 个"邻居"的信息来进行预测分类任务中
复制链接

扫一扫

专栏目录