数据挖掘：降维

最新推荐文章于 2024-09-06 21:50:51 发布

bakalaka

最新推荐文章于 2024-09-06 21:50:51 发布

阅读量1.5k

点赞数 1

分类专栏：大数据系统与大规模数据分析课程

大数据系统与大规模数据分析课程专栏收录该内容

16 篇文章 3 订阅

订阅专栏

本文转载自： https://blog.csdn.net/u013710265/article/details/72633185

为什么要降维？找出规律，压缩数据量。

特征值与特征向量

M矩阵，λ常数，e非零列向量

Me = λe （e为unit vector，第一个非零元素为正）

特征向量是单位向量；特征向量之间正交；特征向量矩阵E的特点，E*E^T = E^T*E = I。

一、PCA（主成分分析）

利用特征向量进行降维。

原理：

将矩阵与一个正交单位向量矩阵相乘，意味着在欧式空间上的旋转。

求MM^T或者M^T的特征矩阵E，对高维数据进行旋转。

原数据变成在新的坐标上的投影。

新的坐标上，第一维是主特征向量指向的那个方向，能量最强。以后依次递减。使降维成为可能。

二、SVD（奇异值分解）

r是A的秩（Rank）

A[m*n] = U[m*r] ∑[r*r] V[n*r]^T

U：左奇异向量（Left singular vectors），单位正交矩阵。

∑：奇异值矩阵（Singular values），对角阵。

V：右奇异向量（Right Singular vectors），单位正交矩阵。

基于SVD的降维：降概念强度最低的那一维。∑矩阵中对角线的值最小。

误差评估：Forbenius norm。实践中：保持80-90%的能量。

与PCA的关系：∑是AA^T的特征值对角阵；U是AA^T的特征向量矩阵；V是A^T*A的特征向量矩阵。

SVD的问题：结果难以解释？为什么那么多维度？U和V很Dense！占空间多。

三、CUR分解

SVD存在问题。在SVD中, 即便M稀疏, U和V仍然密集。而对称矩阵 Σ是稀疏的, 但 Σ 通常比U和V小得多，因此其稀疏性起不到作用。

M = CUR

正确地选择行/列。

构造中间矩阵。

消除冗余的行/列。

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

bakalaka CSDN认证博客专家 CSDN认证企业博客

码龄7年

0: 原创

9万+: 周排名

112万+: 总排名

19万+: 访问

: 等级

1655: 积分

121: 粉丝

100: 获赞

21: 评论

680: 收藏

私信

关注

热门文章

分类专栏

最新评论

自适应滤波器：LMS算法、归一化LMS滤波器
weixin_57277491: M 應該就是指 filter order 吧？
自适应滤波器：LMS算法、归一化LMS滤波器
weixin_57277491: 你好，可以請教如何調整filter order 嗎？
自适应滤波器：递归最小二乘（RLS）
小陈IT: % [s, fs, bits] = wavread('myspeech.wav'); [s,fs] = audioread('myspeech.wav');%读取音频文件,调用音频文件，采样值放在x中，fs为采样频率X=x(:,1);%取矩阵x的第一列赋值到x矩阵中 ainfo=audioinfo('myspeech.wav'); bits=ainfo.BitsPerSample; s=s-mean(s); s=s/max(abs(s)); N=length(s); time=(0:N-1)/fs; clean=s'; ref_noise=.1*randn(1,length(s)); mixed = clean+ref_noise; mu=0.05;M=2;espon=1e-4; % [en,wn,yn]=lmsFunc(mu,M,ref_noise,mixed); % [en,wn,yn]=nlmsFunc(mu,M,ref_noise,mixed,espon); delta = 1e-7; lambda = 1; [en,w]=rls(lambda,M,ref_noise,mixed,delta); function [e,w]=rls(lambda,M,u,d,delta) % recursive least squares,rls. % Call: % [e,w]=rls(lambda,M,u,d,delta) % % Input arguments: % lambda = constant, (0,1] % M = filter length, dim 1x1 % u = input signal, dim Nx1 % d = desired signal, dim Nx1 % delta = constant for initializaton, suggest 1e-7. % % Output arguments: % e = estimation error, dim Nx1 % w = final filter coefficients, dim
自适应滤波器：LMS算法、归一化LMS滤波器
pppomm: 你好，可以发一下完整代码吗？现在的画不出图
自适应滤波器：LMS算法、归一化LMS滤波器
flyingpigeightquit: 博主你好，滤除50hz的算法，会同时对比较宽的一个带宽都有较强衰减，比如200hz的信号也被衰减的很厉害，请问有什么可以分享的方法吗？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。