周志华《机器学习》——降维与度量学习

最新推荐文章于 2022-04-08 18:14:01 发布

zzmmhxs

最新推荐文章于 2022-04-08 18:14:01 发布

阅读量442

点赞数

文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzmmhxs/article/details/115008983

版权

有些数据集是包含非常多的属性的，这使得后续数据处理和计算非常困难。因此需要对数据进行降维，需要找到一种合理的方法，在减少需要分析的属性同时，尽量减少信息的损失。由于各变量之间存在一定的相关关系，因此可以考虑将关系紧密的变量变成尽可能少的新变量，使这些新变量是两两不相关的，那么就可以用较少的综合指标分别代表存在于各个变量中的各类信息。

根据对降维后数据的要求不同，有如下几种常用的数据降维方法：

1、 MDS

MDS降维后的数据满足，从原始空间D到d维空间后，样本两两间距不变。

2、线性变换

Z=W^TX 是一种线性变换。新空间中的属性是原空间中属性的线性组合

根据对低维空间性质的不同要求，不同的任务会在上式的基础上施加不同的约束,主成分分析就是一种线性变换

2.1 主成分分析PAC

PCA是一种线性变换。这个线性变换的约束是最近重构性和最大可分性。

最近重构性：样本点到这个超平面的距离都足够近
最大可分性：样本点在这个超平面的投影能够尽可能分开

上述两个约束对W的约束结果是一样的，优化目标都是

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
周志华《机器学习》——降维与度量学习

有些数据集是包含非常多的属性的，这使得后续数据处理和计算非常困难。因此需要对数据进行降维，需要找到一种合理的方法，在减少需要分析的属性同时，尽量减少信息的损失。由于各变量之间存在一定的相关关系，因此可以考虑将关系紧密的变量变成尽可能少的新变量，使这些新变量是两两不相关的，那么就可以用较少的综合指标分别代表存在于各个变量中的各类信息。根据对降维后数据的要求不同，有如下几种常用的数据降维方法：1、MDSMDS降维后的数据满足，从原始空间D到d维空间后，样本两两间距不变。2、线性变换是一种..
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。