「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义,从而产生更大的价值。
本期 AI Drive,我们邀请到浙江大学助理研究员张宁豫,为大家带来长文本知识抽取:基于语义分割的文档级三元组关系抽取专题报告。对本期主题感兴趣的小伙伴,9 月 29 日(本周三)晚 7 点,我们准时相约 PaperWeekly 直播间。
直播信息
关系抽取 (Relation Extraction) 是从纯文本中提取未知关系事实。过去的关系抽取方法主要将注意力集中于抽取单个实体对在某个句子内反映的关系,然而单句关系抽取在实践中受到不可避免的限制:在真实场景如医疗、金融文档中,有许多关系事实是蕴含在文档中不同句子的实体对中的,且文档中的多个实体之间,往往存在复杂的相互关系。文档级关系抽取旨在从文档中抽取多个实体对之间的关系,然而现有的基于 graph 或基于 transformer 的模型仅单独地使用实体对,而未考虑关系三元组之间的全局信息。
在本文中,我们创新性地提出 DocuNet 模型,将文档级关系抽取任务类比于计算机视觉中的语义分割任务。DocuNet 模型利用编码器模块捕获实体的上下文信息,并采用 U-shaped 分割模块在 image-style 特征图上捕获三元组之间的全局相互依赖性,通过预测实体级关系矩阵来捕获 local 和 global 信息以增强文档级关系抽取。实验结果表明,我们的方法可以在三个基准数据集 DocRED,CDR 和 GDA 上获得 SOTA 性能。
论文标题:
Document-level Relation Extraction as Semantic Segmentation
论文链接:
https://www.ijcai.org/proceedings/2021/0551.pdf
本次分享的具体内容有:
背景介绍:关系抽取的简单介绍
研究动机:文档级关系抽取的难点与挑战
具体方法:介绍提出的模型的主要架构
实验结果:在基准数据集上与之前方法的对比与分析
工作总结:总结与展望
嘉宾介绍
张宁豫 / 浙江大学软件学院助理研究员
张宁豫,博士,浙江大学软件学院助理研究员,阿里巴巴-浙江大学前沿技术联合研究中心(AZFT)研究员,主要研究方向为知识图谱、大数据系统、自然语言处理等,曾在 WWW、KDD、WSDM、AAAI、IJCAI、ACL、ENNLP、NAACL、ACMMM、IEEE TASLP 等国际顶级学术会议和期刊发表多篇论文。
直播地址 & 交流群
本次直播将在 PaperWeekly 视频号和 B 站直播间进行,扫描下方海报二维码或点击阅读原文即可免费观看。线上分享结束后,嘉宾还将在直播交流群内实时 QA,在 PaperWeekly 微信公众号后台回复「AI Drive」,即可获取入群通道。
视频号直播间:
扫描下方二维码关注 PaperWeekly 视频号,第一时间获取开播提醒。
B 站直播间:
https://live.bilibili.com/14884511
合作伙伴
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
·