matlab数值计算淘宝,MATLAB与高维数据分析以及小波多尺度主成分分析

核心提示:这个主题看来值得总结一下,因为在很多技术问题里,这成了一个基本的问题,不熟练一点,真就有点眼高手低了。本博文的想法是把MATLAB统计工具箱里的多元方法和小波分析工具箱里的多尺度主成分分析放在一起谈谈...

这个主题看来值得总结一下, 因为在很多技术问题里,这成了一个基本的问题,不熟练一点,真就有点眼高手低了。本博文的想法是把MATLAB统计工具箱里的多元方法和小波分析工具箱里的多尺度主成分分析放在一起谈谈。

数据处理的背后肯定存在某个控制问题,把数据里隐藏的能够用来构造表达一个系统运动规律的最简捷信息,

那就是数据处理的一个动机之一.高维数据分析的挑战是多方面的,当有幸获得一个计算工具时,应该充分的想一想,套用的模式有没有严重的问题.本文所述的高维数据的分析,中心思想还是一个维度缩减,特别是MATLAB里给的几个函数,它把高维多变量间的关系都映射到二维空间或三维空间里来可视化,事情不是都能这样简化了,这其中更多的内容可以去研究一下拓扑学,高维空间内,有几个问题是要提及的:1、样本数据集中在高维空间的球壳上;2、对于高维空间,数据在低维空间那种可分性变得模糊;3、高维数据的存储检索问题。所以本文的MATLAB方法也仅仅是数据处理的那么一点尝试,不要把它当成灵丹妙药就好。

在高维分析维度缩减中,本质思想是数据近旁(接近)的概念,无论怎么变换,任何数据间这个关系没有变,数据间相对距离没变,那么就可以用子空间的少量数据结构来反映高维空间数据的结构.这其中距离也是个关键的东西,也可以去数学里找它的答案,什么是距离?

传统的多维度分析

在MATLAB里,完成此项任务的过程是,用距离函数pdist计算原始数据的变量间的距离,然后这一步计算得到的距离矢量作为参数送入函数cmdscale,这个函数用距离矢量重新构造一个和原始数据规格大小一样的矩阵(数据值不一样),同时返回这个新构造矩阵的特征值,相应特征值的大小表明这个构造矩阵的相应列对距离值的贡献.如果发现有仅有一个特征值远远大于其它特征值,说明只需要一个变量就可以表达这个多变量系统了,同理,有两个远远大于其它特征值的特征值,那么这个系统只需要两个变量,还用三个的,高于三个的,对于三个变量以内的,就可以用图的方式来直观的观察高维系统在低维空间的对应表示.

非传统多维度分析

MATLAB的这个分析的函数是mdscale,操作方法和传统的多维度分析的cmdscale相差不多,mdscale增加的判据选择参数,支持数据丢失和权重的操作.

非度量多维度分析

非度量多维度分析也用mdscale函数,相对于上面的度量多维度分析,非度量分析降低了要求,非度量逼近一个非线性,但是单调的非相似性变换,只要保证不相似性的序,对于距离可以采取不同尺度的压缩或者膨胀操作.

接下来介绍一下多元小波多尺度主成分分析,摘抄一下MATLAB对该方法的解释,其实理解它还是比较容易的,但是我觉得更重要的事是在别人没有解释直前,自己曾经想过这样的主题思想,有了这种准备,进步的源泉才可能源源不断。

多元小波多尺度度分析的目标是在不同分辨率层次上简化信号的表示,最后重建一个简化的多元信号,多尺度主成分分析推广了一般的多元主成分分析,在这里,PCA同时作用在小波分解不同层次的高频矩阵上,也作用在较粗略的低频系数矩阵上以及最后重建的矩阵上,通过选择要保留的成分的数量,感兴趣的简化的信号就重建起来了。

如果理解了上面的概念,那么使用MATLAB的wavemenu

GUI工具完成多元小波多尺度分析仅仅是眨眼的功夫。比如PCA,要获得旋转矩阵,在MATLAB

下,用cmdscale容易得到重构点,A*R=C,A是原始数据,C是重构点数据,R是旋转矩阵。R=pinv(A)*C,在实际应用中,得到R,后面的计算就很轻松了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值