多视角多对学习方式的相关论文解读

你再翻一页就好了

于 2024-07-22 23:04:46 发布

阅读量597

点赞数 15

文章标签：学习人工智能深度学习

本文链接：https://blog.csdn.net/qq_41542141/article/details/140614847

版权

目标解决问题：
1；地理分布的空气质量和天气站是异质的空间对象，它们监测的条件不同。现有的方法通常设计用于同质的空间对象，不适合联合预测。
2；观察误差累积：监测站的观测数据往往因传感器误差和环境干扰而噪声较大，联合建模可能会导致误差在时空域的累积。

必要操作：

一；由于两个数据来源于两种不同的数据类型，

用类型特定的转换层将异质观测投影到统一的特征空间中
转换过程：
-给定一个监测站 ${s_i}$ ，其观测数据表示为 ${x_i}$ 。
-根据监测站的类型（例如，空气质量监测站或天气监测站），选择对应的转换矩阵 $W_{\psi(i)}$
这里 ${\psi(i)}$ 是一个映射函数，用于标识监测站的类型。
-使用转换矩阵 ${W_{\psi_{(i)}}}$ 对观测数据进行线性变换，将其投影到统一的特征空间中。变换后的特征向量表示为 ${\tilde{x}_i}$ ，其计算公式如下：
${\tilde{x}_i = W_{\psi(i)} x_i}$
其中， ${W_{\psi(i)}}$ 是一个可训练的权重矩阵，其维度为 ${\lvert x_i \rvert \times d}$ ，其中 ${\lvert x_i \rvert}$ 是原始观测数据的维度， $d$ 是统一特征空间的维度。

二；在不同性质的预测模型里分配注意力权重

注意力机制通过在不同的站点之间分配不同的权重来预测，从而更好地捕捉不同站点之间的非线性相关性。
在异质图中，不同类型的监测站和它们的观测数据具有不同的特性，需要类型依赖的注意力机制来分别处理。

假设有两个监测站 $s_i$ 和 $s_j$ ，分别对应转换后的特征向量 $\tilde{x}_i$ 和 $\tilde{x}_j$
它们的环境上下文特征分别为 $c_i$ 和 $c_j$

利用以上可以计算注意力评分

采用一种基于连接的注意力函数（Attention Function），计算站点 $s_i$ 和 $s_j$ 之间的注意力得分。注意力得分反映了 $s_j$ 对 $s_i$ 的重要性。

注意力得分的计算公式如下：
${\alpha_{ij} = \sum_{k \in N_i} \frac{\exp(\text{Attn}(\tilde{x}_i, \tilde{x}_k, c_i, c_k, d_{ik}))}{\exp(\text{Attn}(\tilde{x}_i, \tilde{x}_j, c_i, c_j, d_{ij}))}}$
其中， ${\text{Attn}(\cdot)}$ 表示注意力函数， ${N_{ir}}$ 是类型 $r$ 的邻居站点集合。

注意力函数（Attention Function）：
使用一个连接操作（concatenation）结合特征向量和上下文特征，然后通过一个前馈神经网络计算注意力得分：
$\text{Attn}(\tilde{x}_i, \tilde{x}_j, c_i, c_j, d_{ij}) = \text{LeakyReLU}\left(a^T \left[ W_\theta \tilde{x}_i \parallel W_\theta \tilde{x}_j \parallel W_\phi c_i \parallel W_\phi c_j \parallel W_\delta d_{ij} \right] \right)$
其中， ${\parallel}$ 表示连接操作， $\alpha$ 是一个可训练的权重向量， $W_\theta, \quad W_\phi, \quad W_\delta$ 是可训练的权重矩阵。

$\textcolor{red}{上下文感知异质图卷积操作：}$
基于计算的注意力得分，定义上下文感知的异质图卷积操作来更新站点的表示：
${\tilde{x}_i^{(r)} = GConv(\tilde{x}_i, r) = \sigma\left(\sum_{j \in N_i^{(r)}} \alpha_{ij} W^r \tilde{x}_j\right)}$
其中， ${\tilde{x}_i^{(r)}}$ 是基于边类型 $r$ 聚合后的节点表示， $\sigma$ 是一个非线性激活函数， ${ W^r }$ 是边类型 $r$ 的可训练权重矩阵。
$\textcolor{red}{最终表示的组合：}$
将不同边类型 $r$ 的聚合表示进行连接，形成最终的站点表示：
${\tilde{x}_i' = \sum_{r \in \Psi} GConv(\tilde{x}_i, r)}$