通过深度神经网络实现可扩展性因果图学习

最新推荐文章于 2024-06-19 07:00:00 发布

debug_jxr

最新推荐文章于 2024-06-19 07:00:00 发布

阅读量1.3k

点赞数 1

文章标签：神经网络算法数据挖掘

本文链接：https://blog.csdn.net/baidu_40315524/article/details/112512276

版权

这篇论文提出了一种使用深度神经网络解决因果图学习的方法，重点关注非线性关系的建模。通过低秩分解提高模型的可扩展性，解决了数据噪声、系统多样性和节点数量增加带来的挑战。实验表明，该模型在准确性和收敛性方面优于其他方法，如VAR、PCKGC和Copula等。

摘要由CSDN通过智能技术生成

通过深度神经网络实现可扩展性因果图学习

写在前面

这是一篇CIKM（B类）2019年的论文，用神经网络做因果图学习，和我的研究方向相关，因此做一下笔记。

太长不看版：
输入： $m\times n$ 的矩阵，表示 $m$ 个变量的 $n$ 步时序列
输出： $m\times m$ 的矩阵，表示各变量之间的关联程度（包含非线性）
思想：通过时序预测做自监督训练
过程：

向网络输入 $m\times l$ 的矩阵，l表示预测需要的时序长度
通过改版的ResNet，得到多层 $m\times p$ 的矩阵，表示单节点非线性变量
各矩阵转置经过 $m\times k, k \times k, k \times m$ 的矩阵，得到多个考虑不同变量影响的变量 $m\times p$
将各矩阵拼接在一起，通过MLP得到 $m\times t$ 的多节点非线性变量，再通过一个相同维度的 $R$ 模拟回归系数，然后做点积，得到预测结果
MSE作为 $l o s s$ 并反向传播更新参数
训练结束后3中的三个矩阵相乘作为近似的关联矩阵

论文PDF链接

背景介绍

复杂系统中的因果图学习是非常重要的。现有的方法主要聚焦的是基于预先设定的核或者数据分布而做的因果图学习（也就是说需要具备一定的领域知识），或者只研究了系统中特定的单个目标对剩余节点的影响。同时，现有方法大多只能对线性因果关系进行发掘。而数据的非线性性会给因果图学习带来较大的影响，使得现有方法失效。

从数学上来说，因果图学习的输入是 $X=\{X(1, *), X(2, *),...,X(m,*)\}\in\mathbb R ^ {m\times n}$ ,即有m个变量，每个变量有一个长度为n的序列。输出则是 $A\in\mathbb R^{m \times m}$ 的非负有向矩阵。如果 $A (i, j)$ 远大于 $0$ ，那么说明第 $i$ 个变量是第 $j$ 个变量的影响因子之一。什么是非线性关系？论文中举了一个比较好的例子：
$X(3,t_3)=X(1,t_1)^2+log(X(2,t_1))+X(1,t_2)^{X(3,t_1)}+ X(1,t_1)^3cos(X(3,t_2))$