H. -J. Kim, E. Ollila and V. Koivunen, "Sparse regularization of tensor decompositions," 2013 IEEE International Conference on Acoustics, Speech and Signal Processing, 2013, pp. 3836-3840, doi: 10.1109/ICASSP.2013.6638376.
摘要:
利用张量分解的多线性技术为高维数据分析提供了一个统一的框架。张量分解中的稀疏性明显地改进了多维数据的分析和推理。除了非负张量因式分解,利用稀疏性估计张量的文献是有限的。在本文中,我们引入了张量分解的稀疏正则化方法,这些方法在降维、特征选择和信号恢复方面都很有用。大多数张量分解算法的一个主要挑战是它们严重依赖于良好的初始化。为了缓解这一关键问题,我们提出了一种基于岭回归的可靠方法,利用稀疏性提供良好的初始值。结合这些初始化,我们的稀疏正则化方法在演示的仿真研究中显示出了比传统方法更高的性能。
背景介绍:
随着计算机存储和信息管理的进步,多维数据正变得越来越普遍和普遍。容纳多路数组等数据的张量增加了人们对大数据的兴趣,并将我们的注意力从熟悉的矩阵分解(如奇异值分解(SVD)和主成分分析(PCA))转移到基于张量的科学计算上。多线性模型的张量分解,如CANDECOMP/PARAFAC (CP)[4,9]或Tucker模型[20],用简化的符号和代数[12]为多维数据分析提供了统一的框架。大量的数据往往导致分析的局限性和挑战,张量分解中的稀疏性明显地改善了多维数据的分析和推理。例如,稀疏性可以用于精确的信号恢复。或消除许多现代数据集(如金融和消费者数据、DNA微阵列、互联网网络流量、功能性核磁共振)中不必