降维

最新推荐文章于 2021-09-30 12:36:25 发布

JepsonWong

最新推荐文章于 2021-09-30 12:36:25 发布

阅读量670

点赞数

分类专栏：机器学习文章标签：降维 PCA SVD CUR

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013710265/article/details/72633185

版权

机器学习专栏收录该内容

24 篇文章 2 订阅

订阅专栏

为什么要降维？

找出规律，压缩数据量。

（1）特征值与特征向量

M矩阵，λ常数，e非零列向量

Me = λe （e为unit vector，第一个非零元素为正）

特征向量是单位向量；特征向量之间正交；特征向量矩阵E的特点，E*E^T = E^T*E = I。

（2）PCA（主成分分析）

利用特征向量进行降维。

原理：

将矩阵与一个正交单位向量矩阵相乘，意味着在欧式空间上的旋转。

求MM^T或者M^T的特征矩阵E，对高维数据进行旋转。

原数据变成在新的坐标上的投影。

新的坐标上，第一维是主特征向量指向的那个方向，能量最强。以后依次递减。使降维成为可能。

（3）SVD（奇异值分解）

r是A的秩（Rank）

A[m*n] = U[m*r] ∑[r*r] V[n*r]^T

U：左奇异向量（Left singular vectors），单位正交矩阵。

∑：奇异值矩阵（Singular values），对角阵。

V：右奇异向量（Right Singular vectors），单位正交矩阵。

基于SVD的降维：降概念强度最低的那一维。∑矩阵中对角线的值最小。

误差评估：Forbenius norm

实践中：保持80-90%的能量。

与PCA的关系：∑是AA^T的特征值对角阵；U是AA^T的特征向量矩阵；V是A^T*A的特征向量矩阵。

SVD的问题：结果难以解释？为什么那么多维度？

U和V很Dense！占空间多。

（4）CUR分解

SVD存在问题。With SVD, even if M is sparse, U and V will be dense. Σ, being diagonal, will be sparse, but Σ is usually much smaller than U and V , so its sparseness does not help.

M = CUR

正确地选择行/列。

构造中间矩阵。

消除冗余的行/列。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

JepsonWong CSDN认证博客专家 CSDN认证企业博客

码龄11年

100: 原创

17万+: 周排名

120万+: 总排名

34万+: 访问

: 等级

4126: 积分

111: 粉丝

74: 获赞

9: 评论

375: 收藏

私信

关注

热门文章

分类专栏

计算机系统结构 17篇
人工智能 1篇
机器学习 24篇
神经网络 1篇
自然语言处理 3篇
大数据 15篇
python 9篇
C++ 2篇
Java 3篇
Scala 7篇
Linux 12篇
线性代数 2篇
科学计算 2篇
最优化理论 1篇
开源硬件 9篇
算法 2篇
网络 9篇
TensorFlow 1篇
汇编语言 2篇
安全 1篇
其他 1篇

最新评论

特征工程（补充）--特征组合
Bullet@: 可以具体谈谈是怎么样让特征加减乘除组合的吗？
sklearn：点互信息和互信息
weixin_41980031: 补充说明点互信息也可以通过Sklearn的build in function 来写代码如下 [code=python] from sklearn import feature_selection as fs # xtrain是features # ytrain是labels # 返回的是一个每个features的PMI值的matrix PMI = fs.mutual_info_classif(xtrain,ytrain) [/code]
sklearn：点互信息和互信息
weixin_41980031: 补充说明点互信息也可以通过Sklearn的build in function 来写代码如下 [code=python] from sklearn import feature_selection as fs # xtrain是features # ytrain是labels # 返回的是一个每个features的PMI值的matrix PMI = fs.mutual_info_classif(xtrain,ytrain) [/code]
sklearn：点互信息和互信息
weixin_41980031: 补充说明点互信息也可以通过Sklearn的build in function 来写代码如下 [code=python] from sklearn import feature_selection as fs # xtrain是features # ytrain是labels # 返回的是一个每个features的PMI值的matrix PMI = fs.mutual_info_classif(xtrain,ytrain) [/code]
人工智能三要素
m0_49510957: 无限超级人工智能机器人可以帮助全人类获得无限算能造器来完成全人类的不死永生与无限飞穿！……………

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。