论文笔记Improving Multi-hop Knowledge Base Question Answering by Learning Intermediate Supervision Signa

Improving Multi-hop Knowledge Base Question Answering by Learning Intermediate Supervision Signals

引用格式:[1]He G, Lan Y, Jiang J, et al. Improving multi-hop knowledge base question answering by learning intermediate supervision signals[C]//Proceedings of the 14th ACM International Conference on Web Search and Data Mining. 2021: 553-561.

这个就是把知识蒸馏的思想应用到了KBQA中

源码:RichardHGL/WSDM2021_NSM: Improving Multi-hop Knowledge Base Question Answering by Learning Intermediate Supervision Signals. WSDM 2021. (github.com)

这篇论文是目前(2022/0614) WebQSP的sota模型,CWQ排名第二。

提出了一种新颖的教师-学生方法用于多跳KBQA任务。在该方法中,学生网络旨在找到查询的正确答案,而教师网络试图学习中间监督信号,以提高学生网络的推理能力。主要的新奇之处在于教师网络的设计,利用正向推理和反向推理来增强中间实体分布的学习。通过考虑双向推理,教师网络可以产生更可靠的中间监督信号,可以缓解虚假推理的问题。

图1 伪多跳推理,

红线:期望路线 蓝线:伪正向路径 紫色虚线:回溯路径

绿圈:主题实体红圈:正确答案黄圈:中间实体灰圈:无关实体

除了最终的答案,多跳KBQA算法还能识别出通向答案实体的合理关系路径。在某些情况下,即使找到了正确的答案,关系路径也可能是假的。图1中给出了一个伪多跳推理的例子。问题是“《弗里茨猫的九条命》中演员主演的电影都是什么类型的?”除了正确的路径(带有红色箭头)外,两个包含在第一步中作为主题的实体的伪路径(带有蓝色箭头)也能够到达正确的答案。这主要是由于中间推理步骤缺乏监督信号(称之为中间监督信号)。对于多跳KBQA任务,训练数据通常以<问题,回答>的形式,而不是理想形式的<问题,关系路径>形式。本文遇到的第一个困难是缺乏监督数据集。

由于训练数据中的主题实体和答案实体都是已知的,因此可以联合建模这两个推理过程。找到从主题实体(即查询中的实体)到答案实体的路径的正向推理和从答案实体返回主题实体的反向推理。即正反两个方向的路径进行推理。

方法介绍:

学生网络是基于神经状态机实现的,该方法最初是为了从图像数据中提取场景图的视觉问答而提出的。将知识库考虑为一个图,使其适应多跳KBQA任务,并在多跳推理过程中保持一个逐渐学习的实体分布。为了开发教师网络,修改NSM的体系结构,加入一种新的双向推理机制,使其在中间推理步骤学习到更可靠的实体分布,随后被学生网络用作监督信号。

用于多跳KBQA的神经状态机(NSM),主要由一个指令部分和一个推理部分组成。指令组件向推理组件发送指令向量,推理组件推断实体分布并学习实体表示。

图2 NSM的总体示意图

KBQA给定的KB通常非常大。一个实体很可能被链接到大量的其他实体。该初始化方法能够减少噪声实体的影响,专注于重要的关系语义。此外,它也很容易推广到新的或不可见的、具有已知关系的实体,这对增量训练尤其重要。第二,通过集成前嵌入e(k−1)和关系聚合的嵌入˜e(k)来更新实体嵌入。为了进行比较,原来的NSM分别建模了这两个部分,而该论文在一个统一的更新过程中结合了这两个因素,这有助于得到更有效的节点嵌入。简单来说就是,不计算所有的关系,而是提前计算推理指令与关系的匹配程度,并根据匹配程度来更新词嵌入,以此实现关系聚合

 教师网络

 两种教师网络结构

与学生网络不同,教师网络旨在学习或推断中间推理步骤的可靠实体分布。请注意,没有用于培训教师网络的这种标记实体分发。相反,受双向搜索算法(如双向BFS[17])的启发,加入了双向推理机制,以增强教师网络中中间实体分布的学习。

在给定知识库的情况下,多跳KBQA的推理过程可以看作是图上的探索和搜索问题。大多数现有的多跳KBQA方法从主题实体开始,然后寻找可能的答案实体,称为正向推理。

另一方面,以往的研究忽略了从答案实体到主题实体的反向搜索(称之为逆向推理)。

本文的核心思想是在两个方向上都考虑探索,让两个推理过程在中间阶段相互同步。

教师网络的Optimizing,由两个损失函数组成

推理损失(reasoning loss)反映了预测准确实体的能力,Kullback-Leibler divergence KL 散度,这是一个用来衡量两个概率分布的相似性的一个度量指标。以一种不对称的方式测量两个分布之间的差异。

具体来说,如果图中的k个实体符合真值实体,它们在最终分布中的概率为1/k

通信损失(correspondence loss)反映了两种推理过程中间实体分布的一致性程度。可以通过对中间每一步的损失求和来计算Jensen-Shannon divergence JS散度,一种对称的方式测量两个分布之间的差异

对于CWQ和webqsp数据集,我们首先获取主题实体两跳内的邻域图,然后在其上运行PRN算法。进一步对Freebase中的CVT实体进行一跳扩展,得到邻域子图。如表1所示,2跳图足以覆盖大多数回答实体。而在MetaQA数据集上,我们对整个KB运行PRN算法。具体来说,使用PRN算法[1],e= 1e−6,然后选择m个得分最高的实体。对于较小的MetaQA KB,设置m = 500,对于较大的Freebase,设置m = 2000。对于保留的三元组,其头部和尾部实体均由PRN算法识别的最顶端m个实体得到。我们将三个数据集的统计结果汇总在表1中。实验结果在表2 中

 统计结果

 实验结果

⊗张量积

分布就是符合一定预测规律的概率计算模型

现实生活中,我们使用统计来处理海量的数据,并从数据表现上来预测未来走向,如 人口增长、病毒蔓延、价格波动...不同类型的数据符合各自的变化趋势,统计学家就可以从这个趋势中建立一个数学模型,一个能够完美解释数据的发展历程和预测未来走向的函数关系,这个模型就是“分布”比如,小明经营一家杂货铺,每天必须根据次日的客流量来预定货物。如果已知客流量在不同时间段的变化趋势,也就是分布模型,小明就可以将时间代入模型计算出次日的客人数量,并据此决定进货的数量,避免货物不足或者囤货过多

实体分布(entity distribution)实体的分布律,实体取某个值的概率?

提出了在抽象的潜在空间中进行视觉推理的NSM。对多跳KBQA做了两个主要的调整。首先,通过聚合[(涉及实体的关系)的嵌入]来初始化节点嵌入。

Pagerank算法:PageRank算法的基本想法是在有向图上定义一个随机游走模型,即一阶马尔可夫链,描述随机游走者沿着有向图随机访问各个结点的行为。在一定条件下,极限情况访问每个结点的概率收敛到平稳分布,这时各个结点的平稳概率值就是其PageRank值,表示结点的重要度。PageRank 是递归定义的,PageRank 的计算可以通过迭代算法进行

数量假设:在Web图模型中,如果一个页面节点接收到的其他网页指向的入链数量越多,那么这个页面越重要。

质量假设:指向页面A的入链质量不同,质量高的页面会通过链接向其他页面传递更多的权重。所以越是质量高的页面指向页面A,则页面A越重要。

PR值的计算,列出M(转移矩阵),与V(pr值向量化),V的初始化为1/N

PR=MxV

PR值的修正1,当M中有一列全为0 的时候,将这一列改为1/N,防止出现死端(Dead end)问题

PR值的修正2,当M矩阵对角线上出现1时(A指向A),引入参数β,β一般取(0.8~0.9)正在上传…重新上传取消

防止出现Spider Traps问题

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 提升单目深度估计方法来改进海洋透视。 海洋透视是指由于海洋介质的光学特性,人眼在水下观察物体时出现的模糊和失真现象。为了改善海洋透视,可以利用单目深度估计方法。 单目深度估计是借助计算机视觉技术来估计图像中每个像素点与相机的距离。在传统的单目深度估计方法中,主要依赖于图像中的几何和纹理信息来推断深度。然而,在海洋环境中,由于光线的折射和散射,图像中的几何和纹理信息丧失较多,导致传统方法的准确性下降。 为了克服这个问题,可以通过改进单目深度估计方法来提高海洋透视的效果。一种方法是利用深度学习技术,通过训练神经网络来学习从输入图像中预测深度的映射关系。可以使用已标注的水下图像数据集进行监督学习,使网络能够学习到更准确的深度估计模型。另外,还可以对网络进行迁移学习,使用在陆地环境下预训练的模型,在海洋环境中进行微调,以适应海洋透视的特殊情况。 另一个改进单目深度估计方法的途径是改进特征提取和匹配算法。可以通过使用更好的特征描述子和特征匹配算法,提高单目深度估计的稳定性和准确性。例如,可以使用基于学习的描述子,如深度卷积神经网络提取图像特征,再通过优化的匹配算法实现更准确的深度估计。 总之,通过利用深度学习和改进特征提取与匹配算法,可以显著提高单目深度估计方法在海洋透视上的效果。这将有助于提高水下图像的质量和可视性,在海洋环境下进行相关应用和研究。 ### 回答2: 提升单目深度估计方法以改善水下透视。水下透视是指我们在水下看到的物体变得模糊和失真的现象。为了解决这个问题,研究人员一直在探索使用单目深度估计方法来改善水下透视。 单目深度估计是通过使用单个摄像机来估计图像中物体的距离和深度。在水下,由于水的折射效应,光线会发生折射,导致图像失真。因此,传统的单目深度估计方法往往无法准确估计水下的物体距离和深度。 为了解决这个问题,研究人员提出了一些改进的单目深度估计方法。这些方法包括使用水下场景中的先验知识和模型,从而更好地估计水下物体的深度。例如,可以通过水下传感器捕获的信息来构建水下场景模型,并在深度估计过程中结合使用。此外,还可以利用水下图像的颜色和纹理信息,通过神经网络和机器学习方法进行深度估计。 这些改进的单目深度估计方法的应用可以在水下摄影、水下导航和水下探测等领域中发挥重要作用。例如,在水下摄影中,利用改进的深度估计方法可以提高图像的清晰度和质量,使得拍摄的照片更加真实和可视化。在水下导航和探测中,使用改进的单目深度估计方法可以提供更准确的水下环境信息,从而帮助人们更好地识别、定位和探测水下物体。 总之,改进的单目深度估计方法可以有效地改善水下透视问题,并在水下领域的各个应用中发挥重要作用。随着技术的不断发展,相信这些方法将进一步提升水下图像和数据的质量和可用性。 ### 回答3: 提升海洋透视图像的质量可以通过单目深度估计方法来实现。海洋透视图像通常受到水下湍流、波浪和光线散射等因素的影响,导致图像质量下降。而单目深度估计方法可以通过分析图像中的视差信息来估计场景中的深度信息。 单目深度估计方法有多种实现方式,其中一种常用的方法是基于卷积神经网络(CNN)。该方法通过训练一个深度估计网络,从输入图像中直接预测每个像素的深度信息。训练过程使用带有深度标签的真实图像和对应的深度地图进行,可以通过最小化预测深度与真实深度之间的差异来优化网络参数。 通过使用单目深度估计方法,可以从原始的海洋透视图像中获取更准确和清晰的深度信息。这将有助于改善海洋透视图像的视觉效果和质量。准确的深度信息可以用于场景还原、物体分割和虚实混合等应用中。此外,通过深度估计,还可以对图像进行后续处理,如去除湍流和波浪的影响,进一步提高视觉效果。 总而言之,使用单目深度估计方法可以有效地改善海洋透视图像的质量。这一方法通过分析图像中的视差信息来预测深度信息,从而提供更准确和清晰的深度信息。这将有助于改善海洋透视图像的视觉效果和质量,并为进一步的图像处理提供基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值