今晚直播 | 微软亚洲研究院徐毅恒:预训练时代下的文档智能

「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义,从而产生更大的价值。

本期 AI Drive,我们邀请到微软亚洲研究院自然语言计算组实习生徐毅恒,为大家带来预训练时代下的文档智能专题直播。对本期主题感兴趣的小伙伴,今晚 7 点,我们准时相约 PaperWeekly B 站直播间。

直播信息

文档智能是一种旨在针对富文本文档进行理解并抽取其中非结构化信息的技术。LayoutLM 的成功证明了针对文本和布局进行预训练的有效性。在此基础上,我们提出了多模态预训练模型 LayoutLMv2 及其多语言扩展 LayoutXLM,通过对文本、布局和图像进行联合预训练,进一步提高了模型的性能,在多项任务中取得了新的突破。

LayoutLMv2:

https://aclanthology.org/2021.acl-long.201/

开源代码:

https://aka.ms/layoutlmv2

LayoutXLM:

https://arxiv.org/abs/2104.08836

开源代码:

https://aka.ms/layoutxlm

文档智能综述:

https://www.microsoft.com/en-us/research/publication/document-ai-benchmarks-models-and-applications-in-chinese/

本次分享的具体内容有: 

  • 文档智能背景以及 LayoutLM

  • LayoutLMv2:新一代多模态文档理解模型

  • LayoutXLM:针对多语言文档的扩展

  • 文档智能前沿综述

嘉宾介绍

 徐毅恒 / 微软亚洲研究院实习生 

徐毅恒,微软亚洲研究院自然语言计算组实习生,研究方向为自然语言处理和多模态文档理解。目前在 KDD, ACL, COLING 等国际会议发表论文。

直播地址 & 交流群

本次直播将在 PaperWeekly B 站直播间进行,扫描下方海报二维码点击阅读原文即可免费观看。线上分享结束后,嘉宾还将在直播交流群内实时 QA,在 PaperWeekly 微信公众号后台回复「AI Drive」,即可获取入群通道

B 站直播间:

https://live.bilibili.com/14884511

合作伙伴

????

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值