机器学习（6）

Mr. Morningstar

于 2022-06-17 20:36:47 发布

阅读量51

点赞数

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46218732/article/details/125339878

版权

降维与度量学习

k近邻学习（KNN）

监督学习方法

机制	以某种方式找到训练集中与测试样本最近的k个值，以这k个值来预测
投票法	选择K个样本中出现最多的类别标记作为结果
平均法	为k个样本加权（平均）得到结果
懒惰学习	KNN是典型的懒惰学习，训练阶段仅保存样本，得到测试样本后才处理

低维嵌入

只有样本密度足够大，才能满足KNN的取样原则

但是随着维度增加，所要的数据数量增加极快，远超当前计算能力。

高维会出现样本稀疏、距离计算困难的维数灾难

因此降维很重要

若要求原始空间中样本间距离能够在降维后保持，可以使用多维缩放（MDS，multiple dimensional scaling）

最简单的是线性变换

通过比较降维前后学习器的性能可以对降维效果进行评估

主成分分析

principal component analysis ， PCA

最常用的一种降维方法

最近重构性	样本点到这个超平面的距离都足够近
最大可分性	样本点在这个超平面上的投影进尽能分开

降维之后会舍弃一部分信息，但是有两个好处

1、增加了数据的密度

2、一定程度上去噪

核化线性降维

基于核技巧对线性降维进行核化

流形学习

manifold learning

借鉴了拓扑流形的概念，具有局部欧氏空间的性质

可被用于可视化

等度量映射（Isomap）

测地线：实际走过去的最短距离（本真距离）

因为高维中欧氏距离（两点连线）与其本真距离不一致，所以要想得到其本真距离采用近邻连接图。

一种是指定近邻点个数

一种是指定距离阈值，阈值内的才被当作近邻点

局部线性嵌入（Locally Linear Embedding）

保持邻域内样本之间的线性关系

度量学习

通过学习找到合适的距离

太难了

开摆

参考文献：

周志华. 机器学习

Mr. Morningstar

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习（6）

降维与度量学习k近邻学习（KNN）监督学习方法机制以某种方式找到训练集中与测试样本最近的k个值，以这k个值来预测投票法选择K个样本中出现最多的类别标记作为结果平均法为k个样本加权（平均）得到结果懒惰学习KNN是典型的懒惰学习，训练阶段仅保存样本，得到测试样本后才处理低维嵌入只有样本密度足够大，才能满足KNN的取样原则但是随着维度增加，所要的数据数量增加极快，远超当前计算能力。高维会出现样本稀疏、距离计算困难的维数灾难因此降维很重要若要求原始空间中样本间距离能够在降维后保持，可以使用多维缩放...
复制链接

扫一扫

Mr. Morningstar CSDN认证博客专家 CSDN认证企业博客

码龄5年

13: 原创

52万+: 周排名

24万+: 总排名

5338: 访问

: 等级

133: 积分

4: 粉丝

3: 获赞

1: 评论

12: 收藏

私信

关注

热门文章

最新评论

Zotero论文格式去除DOI、链接、中英文可识别
CSDN-Ada助手: 恭喜您撰写了第13篇博客！标题中提到的去除DOI、链接以及中英文可识别的方法似乎非常实用。我相信这篇博客一定能帮助到很多人。感谢您持续不断地分享有价值的内容。对于下一步的创作建议，我想提出一点小建议。或许您可以考虑进一步探讨如何优化论文格式，以提高读者的阅读体验。例如，您可以分享一些关于如何排版论文以使其更易读、更具吸引力的技巧。这样的主题可能会引起更多读者的兴趣，同时也有助于提升他们的学术写作水平。再次恭喜您的努力和成果，期待您未来更多精彩的创作！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。