微软熊辰炎：如何利用图神经网络解决半结构化数据问题？

智源社区

于 2020-08-21 17:53:32 发布

阅读量1.6k

点赞数 2

文章标签：大数据 python 机器学习人工智能知识图谱

本文链接：https://blog.csdn.net/BAAIBeijing/article/details/108162791

版权

微软研究院高级研究员熊辰炎博士分享了如何利用图神经网络处理半结构化数据，特别是在信息检索和知识图谱中的应用。他介绍了Transformer-XH模型，该模型能整合文本信息和结构化知识，提升表征性能。演讲强调了半结构化数据的重要性，提出了Free-Text Knowledge Graph的概念，并展示了在多跳问答系统和事实验证等任务中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

对于许多信息检索和知识图谱研究者来说，究竟应该使用抽象的结构化信息进行表示学习还是使用海量的文本信息始终是一个富有争议的话题。在本届智源大会上，来自微软研究院的高级研究员熊辰炎博士带来了题为“利用半结构化知识的表示学习与信息检索”的主题报告，结合其近年来在 ICLR、ACL、WebConf 上发表的相关工作，介绍了如何从半结构化知识的视角同时利用符号知识与纯文本信息，从而提升表征性能与效率。

熊辰炎

熊辰炎，微软研究院高级研究员。主要研究方向：信息检索，自然语言处理和深度学习的结果。近期研究兴趣是长文本里面，对话信息检索和深度信息检索等。2018年卡耐基梅隆大学语言技术研究所博士。在信息检索，自然语言处理，深度学习等会议上发表论文30余篇。参与组织多次相关领域研讨会，宣讲会，以及美国国家标准局TREC竞赛等。

尽管本次演讲的标题中没有「图神经网络」等字眼，但其内容都围绕图神经网络展开。本次演讲将侧重于实际的问题、知识以及工业界常用任务中的半结构化数据，探讨如何利用图神经网络对半结构化数据进行表示学习，以及如何使用较为统一的框架解决实际中的问题。

本次演讲的内容主要分为两部分，首先，我们将从统一的「半结构化」的视角讨论知识图谱以及各种信息检索任务（例如，问答系统、事实验证、假新闻检测、信息搜索）；接着，我将介绍我们近期提出的一种 Transformer 模型，它能够整合各种不同任务的信息，并学习其表征，从而完成这些任务。