AMiner会议论文推荐第三十期

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。


IJCAI 2020 论文推荐

Reasoning Like Human: Hierarchical Reinforcement Learning for Knowledge Graph Reasoning

论文链接https://www.aminer.cn/pub/5ef96b048806af6ef27720d1/?conf=ijcai2020

推荐理由:知识图(Knowledge Graphs)通常存在不完整的问题。一种流行的知识图完整方法是利用多跳推理在连接一对实体的其他路径上发现的信息来推断缺失的知识。然而,因为推理过程中通常会遇到多重语义问题,即一个关系或一个实体具有多重含义,多跳推理仍然具有挑战性。为了应对这种情况,作者提出了一种新型的层次强化学习框架,从知识图谱中自动学习推理链。该框架的灵感来自于人类处理认知模糊案例的层次结构。整个推理过程被分解为一个层次的两级强化学习策略,用于编码历史信息和学习结构化的行动空间。因此,该工作在处理多语义问题上更加可行和自然。
在这里插入图片描述
在这里插入图片描述
Financial Risk Prediction with Multi-Round Q&A Attention Network

论文链接https://www.aminer.cn/pub/5ef96b048806af6ef2772247/?conf=ijcai2020

推荐理由:财务风险是投资的重要指标,它可以帮助投资者更好地了解市场和公司。在影响财务风险的众多因素中,研究人员发现财报电话会议是最重要的因素。预测财报电话会议后的财务波动对包括投资者和公司管理者在内的受益者至关重要。然而,以往的工作主要集中在字词级或文档级的特征提取上,忽略会议中的重要结构–交替对话。在本文中,作者引入了Multi-Round Q&A Attention Network,这种模型首先考虑了对话形式。基于财报电话会议记录的数据,上述模型通过双向关注机制提取每一轮对话的特征,并预测财报电话会议事件发生后的波动率。结果证明,该模型在三个不同时期的表现明显优于以往最先进的方法和其他基线。在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
Polar Relative Positional Encoding for Video-Language Segmentation

论文链接https://www.aminer.cn/pub/5ef96b048806af6ef277204d/?conf=ijcai2020

推荐理由:在本文中,作者解决了一个名为视频语言分割的任务。该任务给定一段视频和一个自然语言的句子,目标是分割视频帧中该句子所描述的对象或行为者。本文提出了一种新型的极地相对位置编码(Polar Relative Positional Encoding,PRPE)机制,以 "语言 "的方式表示空间关系,即利用方向和范围。句子特征可以以更直接的方式与位置嵌入交互,提取隐含的相对位置关系。同,该研究还提出了针对这些位置嵌入的参数化函数,以适应实值方向和范围。通过PRPE,作者设计了一个极地注意力模块(Polar Attention Module,PAM)作为视觉-语言融合的基本模块。在具有挑战性的A2D句子数据集上,上述方法在mAP方面以11.4%的绝对改进幅度优于之前的最佳方法。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

AAAI 2021 论文推荐

Spectral Distribution aware Image Generation

论文链接https://www.aminer.cn/pub/5fcf52ce91e011f4c80bac83/?conf=aaai2021

推荐理由:照片现实图像(photo-realistic images)的深度生成模型方面近期取得了较大的进展,为人们带来了高质量的视觉效果。这种模型可以学习从给定的训练分布中生成数据,从而使生成的图像不容易被人眼与真实图像区分开来。然而,近期对这类假图像的检测工作指出,它们实际上很容易通过其频谱中的伪影来辨别。在本文中,作者提出了利用采用频谱鉴别器,根据真实数据的频率分布来生成图像。该研究中的鉴别器是轻量级、模块化的,能够稳定地工作在各种的常用GAN损失下。作者表明,该模型可以生成具有真实频率谱的图像,它们很难通过频谱方法进行检测辨别。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
Transfer Learning for Efficient Iterative Safety Validation

论文链接: https://www.aminer.cn/pub/5fd33b6b91e01161cf7394c2/?conf=aaai2021

推荐理由:在开发安全关键型自主系统的过程中,安全验证(safety validation)非常重要,但需要大量的计算工作。现有的算法往往在每次被测系统发生变化时都要从头开始。因此,作者提出应用转移学习,以提高基于强化学习的安全验证算法应用于相关系统时的效率。具体来说,来自之前安全验证任务的知识通过动作值函数进行编码,通过一组学习的注意力权重转移到未来的任务中。同时,每个源任务中都包含学习的状态和动作值转换,即使系统具有实质不同的故障模式,也能提高性能。作者在网格世界和自动驾驶场景下进行了安全验证任务的实验,证明了转移学习能够改善验证算法的初始和最终性能,并减少训练步骤的数量。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
Cross-Domain Grouping and Alignment for Domain Adaptive Semantic Segmentation

论文链接https://www.aminer.cn/pub/5fd9ec7e91e0111ad2b2555b/?conf=aaai2021

推荐理由:在深度卷积神经网络(CNNs)中,现有的适应跨源域和目标域的语义分割网络的技术以全局或类别感知的方式处理来自两个域的所有样本。它们不考虑目标域本身或估计类别内的类间变化,对编码具有多模态数据分布的域造成了限制。为了克服该限制,作者引入了一个可学习的聚类模块,以及一个新的领域适应框架,称为跨领域分组和对齐(cross-domain grouping and alignment)。为在不影响源域精确分割能力的前提下最大限度地实现跨域聚类,作者提出了两个损失函数,特别是用于鼓励聚类之间的语义一致性和正交性。同时,作者还提出了一个损失,以便解决类不平衡问题。在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
Constrained Risk-Averse Markov Decision Processes

论文链接: https://www.aminer.cn/pub/5fcdfb9091e01124d5ec3e87/?conf=aaai2021

推荐理由:作者考虑为具有动态一致性风险目标和约束的马尔科夫决策过程(Markov decision processes,MDPs)设计政策的问题。该研究首先在一个拉格朗日框架中表述上述问题。在假设风险目标和约束可以用马尔科夫风险过渡映射来表示的情况下,作者提出了一种基于优化的方法来综合降低约束风险规避问题的马尔科夫策略。作者证明了所制定的优化问题是差分凸程序(difference convex programs,DCP)的形式,并且可以通过有纪律的凸凹编程(disciplined convex-concave programming,DCCP)框架来解决。该工作表明,这些结果概括了具有总折现预期成本和约束的约束MDPs的线性程序。最后,作者通过对涉及条件风险值(conditional-value-at-risk,CVaR)和熵风险值(EVaR,entropic-value-at-risk)相干风险度量的漫游车导航问题的数值实验说明了提出方法的有效性。在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

ICLR 2021论文推荐

Prototypical Contrastive Learning of Unsupervised Representations

论文链接: https://www.aminer.cn/pub/5eba73be91e01108d77cf8a1/?conf=iclr2021

推荐理由:本文介绍了原型对比学习(Prototypical Contrastive Learning , PCL),这是一种无监督的表示学习方法,解决了流行的实例对比学习的根本局限性。PCL将数据的语义结构隐式编码到学习的嵌入空间中,避免网络仅仅依靠低级线索来解决无监督学习任务。具体来说,作者引入原型作为潜变量,以帮助在期望-最大化框架(Expectation-Maximization framework)中找到网络参数的最大似然估计。作者迭代执行E步骤,通过聚类来寻找原型的分布,而M步骤则通过对比学习来优化网络。该研究提出了ProtoNCE loss,这是InfoNCE loss的一个通用版本,通过鼓励表征更接近其分配的原型来进行对比学习。PCL在多个无监督的表征学习基准上取得了最先进的结果,其中在低资源传输任务中的准确性提高了>10%。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
How Neural Networks Extrapolate: From Feedforward to Graph Neural Networks

论文链接: https://www.aminer.cn/pub/5f6dc84991e01153370055fc/?conf=iclr2021

推荐理由:作者研究通过梯度下降训练的神经网络如何外推,即它们如何在训练分布的支持之外学习到的东西。以往的工作报告了用神经网络进行外推时的混合经验结果:多层感知器(multilayer perceptrons,MLPs)在简单的任务中不能很好地外推,而具有MLP模块的结构化图神经网络(Graph Neural Networks,GNNs)在更复杂的任务中取得了一些成功。作者提供了一个理论解释,并确定了MLPs和GNNs推断良好的条件。该工作首先展示了通过梯度下降训练的ReLU MLPs沿着从原点出发的任何方向快速收敛到线性函数,这表明ReLU MLPs在大多数非线性任务中不能很好地外推。另一方面,当训练分布足够 "多样化 "时,ReLU MLPs可以被证明收敛到线性目标函数。这些观察结果促成了一个假设,即如果在架构和输入表示中编码适当的非线性,GNNs可以在动态编程(dynamic programming, DP)任务中很好地外推。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

订阅了解更多论文信息,定制您的个人科研动态信息流https://www.aminer.cn/user/notification?f=mt

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值