从复制粘贴走向推理合成
AI编程中的组合泛化
刘乾,北京航空航天大学与微软亚洲研究院联合培养博士,博士期间的主要研究方向为语义解析、对话系统和组合泛化,以第一作者身份在NeurIPS、ACL、EMNLP等会议中发表多篇论文。
⭐
关于直播
报告主题
从复制粘贴走向推理合成:AI编程中的组合泛化
报告简介
近年来,深度学习模型在各种任务上都取得了非常大的成功。然而,不同于人类可以从少量样本中快速学习,深度学习模型的成功仍依赖于大量训练数据。那么,深度学习模型是否有可能拥有人类这种快速学习的能力呢?一个关键问题就在于深度学习是否可以拥有组合泛化能力。
组合泛化是人类的一种基本而又必不可少的能力,通过理解已知部件的未知组合,人类可以利用有限的语言元素理解无限的自然语言世界。因此,越来越多研究者关注在组合泛化这个问题上,尤其是在AI编程领域。2018年,纽约大学和Facebook的科学家们提出一个组合泛化领域的经典测试基准SCAN,测试任务是将诸如“run after walk”这样的自然语言解析成诸如“WALK RUN”这样的导航指令。然而他们发现,目前最先进的深度学习模型,甚至包括预训练模型,在这个测试基准上表现得都尤其差。
为了解决这个问题,我们指出组合泛化的核心在于建模语言之间的同态映射,并在该思想的指导下提出一种新颖的记忆增强的神经模型LANE。我们的模型是第一个在无需额外资源情况下就能通过SCAN上所有组合泛化测试基准的神经网络模型。虽然LANE在SCAN上的成功要推广到更真实的场景还有一段距离要走,但我们相信对组合泛化的研究可以推动AI编程向更加智能的推理合成迈进。
直播间信息
会议主题:从复制粘贴走向推理合成:AI编程中的组合泛化
会议时间:2020/12/07 19:00-19:30
会议 ID:500 716 605
手机一键拨号入会
+8675536550000,,500716605#(中国大陆)
+85230018898,,,2,500716605#(中国香港)
根据您的位置拨号
+8675536550000 转(中国大陆)
+85230018898 转(中国香港)
与会成员:Houye;
扫码加入QQ讨论群,与志同道合的小伙伴们一起学习,共同进步!更有更多专业大佬随时随地解答你的困惑。
【严肃脸.jpg】
因为微信平台算法改版,微信公众号不再以时间顺序排序展示,且部分推送可能会被限流,如果大家不想错过直播/学习信息,强烈建议⭐给我们一颗小星星⭐并且多多点【赞/在看】。
⭐点亮小星星⭐的步骤为:
1 点击最上方“图与推荐”,进入公众号主页
2 点击右上角的小点点,在弹出界面点击“设为星标”,就可以啦!
图与推荐
扫码关注我们/设为星标
图神经网络/推荐算法/图表示学习
您的“点赞/在看/分享”是我们坚持的最大动力!
坚持不易,卖萌打滚求鼓励 (ฅ>ω<*ฅ)