稀疏表示河流多元信息处理
前言
现有来自黄河流域的大量钻孔数据,需要完成以下任务:
-
简单概括多源数据稀疏表示的基本原理?
-
如下图,BX、MQ、WB钻孔数据来自于金沙江、嘉陵江、汉江和废黄河四个源头的比重是多少?
-
在题目2的基础上讨论利用PCA给多源数据适当的降维,换句话说就是计算不同个数的元素(Al、Fe、K、Ca、Na、Mg、Ti、Mn、Sr、Ba、V、Cr、Ni、Xlf、Xarm、SIRM、HIRM100、HIRM300、S-100、S-300、Xarm/SIRM)的组成份对钻孔数据来自于金沙江、嘉陵江、汉江和废黄河的比重的影响。
-
利用高斯核函数方法将EXCEL表中的多源数据进行数据生成使得计算的结果与题2中相似。
具体步骤和结果
一、简要介绍多源数据稀疏表示
1)稀疏表示:
当一个信息号X(可表示为N维列向量的一组向量),可以通过一组N*M的基向量空间,与系数矩阵的乘积表示,如下图.这时候即可用一个M维的列向量映射表示原信号量,
这种情况下,数据量可能变大,也可能变小。但这种情况下基向量空间,与系数矩阵都是自己构造,这就可能出现一种情况,即系数矩阵中非0数据 小于N,此时有效数据(非0)数据小于原数据(N维),成功对数据进行缩减。则这可以称为稀疏表示。
2)稀疏表示在多源信息中的应用:
在上图中,表示了原信息,字典,系数矩阵的关系。在数据处理中,如图像处理中问题中,信息号为原图像,字典是训练的原训练数据,系数矩阵就是信号量来自原训练数据的权重比重。当系数矩阵是稀疏表示(非0数据小于原数据量)。也就是字典(数据集)中有限原子 有效表示的原图像。<