Provable Tensor Factorization with Missing Data论文总结

最新推荐文章于 2024-09-26 17:23:00 发布

zl12121

最新推荐文章于 2024-09-26 17:23:00 发布

阅读量947

点赞数 25

文章标签：人工智能

本文链接：https://blog.csdn.net/A4686512/article/details/142025390

版权

提出一种使用正交分解的张量方法，来尝试以有限数据来补全或者预测miss数据，并给出了有限数据的下限值的理论支持和证明过程，为了保障正交性，提出了Robust Tensor Power Method（RTPM）来进行约束，没有使用神经网络mlp，而是使用最小交替二乘法，并提出当基向量在已经确保正交后，还需要进行向量的分量的模不相干均衡，也给出了一些阈值的计算和实验。最后提出了一些数学上的分析和证明过程。

1、张量的分解思路

这是一个张量，张量表示了一个3维场景。我们要进行张量分解，使用的依旧是low rank低秩张量来表达高阶张量，大部分的论文都是 xyz三个方向的三维，比如tensorRF论文，这是从张量的三个方向视角来看待的，而本文是从特征正交的方向来分解的，也就是说从内容上来作为视角方向。

2、不相干系数决定了正交基的一些约束

这是一个不相干系数，主要解决的是如果一个多维向量比如100维是一个基向量，也就是模长为1，不能出现1-99维度都是0.00001之类的数据，100维的时候为 0.9，这就不均衡，为什么要求均衡，作者提出了只有均衡的维度分布才能更好的代表数据或者说拟合，这个暂且就这么认为吧，毕竟特征这两字本身就是和数学上不能一一绝对对应的。

提出这个不相干主要是要使用一个衡量，解决正交问题，比如定义了48个基向量，要正交，就必须使得两两向量积为0，所以专门引入 Robust Tensor Power Method（RTPM）来为张量分解提供高质量的初始估计。传统的方法可能在初始化时较为随机或简单，而 RTPM 能够通过特定的迭代和近似操作，使得初始的基向量更接近正交，为后续的分解过程奠定更好的基础。论文使用的是最小二乘法