降维的主要方法

最新推荐文章于 2024-01-26 19:35:19 发布

preston2006

最新推荐文章于 2024-01-26 19:35:19 发布

阅读量776

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/preston2006/article/details/11574581

版权

PCA和SVD

其中，PCA主要用到协方差矩阵。

参考这篇文章：http://hi.baidu.com/ifengzh/item/8851b6387aebefc4382ffa60

1:原始特征

为了方便，我们假定数据是二维的，借助网络上的一组数据，如下：
x=[2.5, 0.5, 2.2, 1.9, 3.1, 2.3, 2, 1, 1.5, 1.1]T
y=[2.4, 0.7, 2.9, 2.2, 3.0, 2.7, 1.6, 1.1, 1.6, 0.9]T

2、计算协方差矩阵：

什么是协方差矩阵？相信看这篇文章的人都学过数理统计，一些基本的常识都知道，但是，也许你很长时间不看了，都忘差不多了，为了方便大家更好的理解，这里先简单的回顾一下数理统计的相关知识，当然如果你知道协方差矩阵的求法你可以跳过这里。

（1）协方差矩阵：

首先我们给你一个含有n个样本的集合，依次给出数理统计中的一些相关概念：

均值：
标准差：
方差：

既然我们都有这么多描述数据之间关系的统计量，为什么我们还要用协方差呢？我们应该注意到，标准差和方差一般是用来描述一维数据的，但现实生活我们常常遇到含有多维数据的数据集，最简单的大家上学时免不了要统计多个学科的考试成绩。面对这样的数据集，我们当然可以按照每一维独立的计算其方差，但是通常我们还想了解这几科成绩之间的关系，这时，我们就要用协方差，协方差就是一种用来度量两个随机变量关系的统计量，其定义为：

从协方差的定义上我们也可以看出一些显而易见的性质，如：

(X的方差)

需要注意的是，协方差也只能处理二维问题，那维数多了自然就需要计算多个协方差，比如n维的数据集就需要计算个协方差，那自然而然的我们会想到使用矩阵来组织这些数据。给出协方差矩阵的定义：

这个定义还是很容易理解的，我们可以举一个简单的三维的例子，假设数据集有三个维度，则协方差矩阵为

可见，协方差矩阵是一个对称的矩阵，而且对角线是各个维度上的方差。

3、计算协方差矩阵的特征值和特征变量，求出的特征向量按照特征值的大小进行组合形成一个映射矩阵，并根据指定的PCA保留的特征个数取出映射矩阵的前n行或者前n列作为最终的映射矩阵。

4、用步骤3的映射矩阵对原始数据进行映射，达到数据降维的目的。

SVD，奇异值分解。

共同点都是取特征值比较大的几个特征值重新构建矩阵。

不同：实现方法不一样

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

preston2006 CSDN认证博客专家 CSDN认证企业博客

码龄17年

61: 原创

110万+: 周排名

205万+: 总排名

9万+: 访问

: 等级

1547: 积分

21: 粉丝

14: 获赞

18: 评论

23: 收藏

私信

关注

热门文章

分类专栏

个人编程 1篇
vc 4篇

最新评论

yael
qq_42520689: 博主您好，yael的下载链接打不开了。可以分享一下yael吗，万分感谢！
FFMPEG release版本编译出错
Tisfy: 这篇帖子，就好比黑暗中刺裂夜空的闪电
linux 编译flann-1.8.4-src（matlab）
gakki_Yuibo: 还是无法编译找不到文件
DPM
qq_38972038 回复 Zhang_Sir_Coder: 这是5 6年前的博客你还指望博主回复你吗(づ ●─● )づ
DPM
Zhang_Sir_Coder: 请问博主能否详细说明一下not enough space 问题的解决方法？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。