DisMASTD: An Efficient Distributed Multi-Aspect Streaming Tensor Decomposition
张量分解是许多数据驱动应用的基本多维数据分析工具,例如社会计算、计算机视觉和生物信息学。然而,快速增长的流数据给传统的静态张量分解带来了新的挑战。它需要一个高效的分布式动态张量分解,而不需要从头开始重新计算整个张量。本文提出了DisMASTD,一种高效的分布式多角度流张量分解方法。首先,证明了最优张量划分问题是np难问题。其次,提出了两种启发式的张量划分方法来保证负载均衡。再次,提出了一种分布式多角度流张量分解计算方法,通过维护和重用中间结果,避免了重复计算,减少了网络通信量。最后,在真实和合成数据集上进行了广泛的实验,以证明DisMASTD的效率和可扩展性。
阅读者总结:分布式动态张量分解问题