EMNLP 2022半监督和强化对话系统挑战赛持续火热报名中,7月1日截止

cfe360bdebb114b6ff6338dd176ae5cf.png

EMNLP是由国际语言学会(ACL)主办的自然语言处理领域的顶级国际会议。特定主题的研讨会(Workshop)是 EMNLP 大会议程的精彩部分,每年从全球学者的提案(Proposal)中遴选。EMNLP 2022 Workshop Proposal 竞争激烈,在 EMNLP 官方公布的 2022 Workshop Proposal 收录结果中,由清华大学和中国移动联合承办的 SereTOD Workshop “Towards Semi-Supervised and Reinforced Task-Oriented Dialog Systems” 及相关挑战赛 SereTOD Challenge 名列其中。

赛事背景

自然语言对话交互是人工智能的核心技术,对未来智能化社会和经济的发展起着重要作用。目前人机对话系统严重依赖人工规则和标注,制约跨领域规模化应用。各类半监督和强化方法及其在对话系统中的应用,孕育着重要的技术发展趋势,也面临诸多挑战。本次SereTOD研讨会及挑战赛,旨在促进国际上相关学者的交流合作,推动人工智能对话核心技术的未来发展。

“EMNLP2022 半监督和强化对话系统挑战赛”,由清华大学中国移动共同发起,已于2022年4月29日正式上线启动,目前正在面向全球接受报名,并即将于2022年7月1日截止报名。

0d00336744ef887072030ce56ffd3873.png

62fdadec47ad5bf96e4cde6f8633e7c3.png

79c3b57d786aed6f507de7c9cb80d55c.png

赛事亮点

SereTOD 挑战赛基于中国移动客服对话数据(Mobile Customer-Service Dialog,MCSD),具有以下鲜明特点:

首个十万量级人人对话数据集

MCSD数据集来源于现实世界的真实对话场景,包含数据安全过滤后近十万通用户与运营商客服间的咨询类对话日志,是迄今为止首个十万量级面向任务的多领域公开人人对话数据集,为促进对话大模型、口语化人人对话系统、数据驱动的体系化对话分析等研究目标提供有力的数据支撑。

助力人机对话模型及研究范式突破

目前的人工智能技术过度依赖有监督学习和高成本人工标注,泛化性不足,领域知识难以有效利用。各类半监督和强化方法,包括预训练 (pre-training)、自训练 (self-training)、自监督 (self-supervised)、弱监督 (weakly-supervised)、零样本/少样本迁移学习 (transfer learning for zero-shot or few-shots)、隐变量建模 (latent-variable modeling)、领域自适应 (domain adaptation)、数据增强 (data augmentation)、强化学习 (reinforcement learning) 等,孕育着重要的技术发展趋势。本次公开的MCSD数据集不仅服务于竞赛任务,更有助于人机对话模型的创新及研究范式的突破。

双赛道竞赛任务面向实际需求

本挑战赛聚焦半监督和强化对话系统,不仅关注任务相关知识的抽——对话数据的信息抽取;还关注对话系统本身的构建——客服场景任务型对话系统的构建。

赛事规则

SereTOD挑战赛具体分为两条赛道。组委会将提供约 10,000 通标注语料和 90,000 通未标注语料,以及两个赛道的基线系统。

赛道一(Track 1)

基于对话数据的信息抽取

此赛道包括实体抽取和槽值填充。在真实客服对话中实体以不同的表示形式被提及,如何准确提取实体及槽值,是建立对话系统知识库的重要步骤。

赛道二(Track 2)

任务型对话系统构建

此赛道要求构建一个客服场景的任务型对话系统,进行基于测试语料的离线客观评估和人工交互式评估。

报名通道

登录挑战赛官网:http://seretod.org/Challenge.html

下载并填写报名表。将填写完毕的报名表发送到邮箱seretod2022@gmail.com,报名截止日期为2022年7月1日

每个赛道得分排名前三的队伍将会获得奖金和荣誉证书。得分排名靠前的队伍,将优先邀请投稿到 EMNLP 2022 Workshop,接收的论文将收入 EMNLP 论文集。

  • 冠军:20,000现金奖励,颁发荣誉证书

  • 亚军:15,000现金奖励,颁发荣誉证书

  • 季军:10,000现金奖励,颁发荣誉证书

赛事时间节点

日期

详细安排

7月1日

挑战赛报名截止

7月1日

训练数据发布

8月14日

评估数据发布

8月21日

最终提交截止

8月31日

评估结果发布

9月7日

Workshop 论文提交截止

12月7日

Workshop 举办暨挑战赛颁奖

SereTOD挑战赛组委会

  • 欧智坚    清华大学

  • 冯俊兰    中国移动

  • 李涓子    清华大学

  • 李亚坤    清华大学

  • 刘一红    清华大学

  • 彭一皓    清华大学

  • 黄一毅    中国移动

  • 赵江江    中国移动

ad28cd5b42801e62084f1fb20a76546b.gif

1b9c34d681482b869856cf8057776034.png

7f443a97796c1d4260168de64a47947e.gif

EMNLP2022 SereTOD Workshop官网

http://seretod.org

4月29日挑战赛发布暨研讨会,邀请了领域内顶尖学者分享人工智能对话系统技术前沿,探讨构建半监督和强化对话系统面临的挑战,共同推动该领域的发展。研讨会由清华大学电子工程系欧智坚教授和中国移动研究院首席科学家冯俊兰博士主持,嘉宾包括:

  • 京东集团技术副总裁 何晓东

  • 阿里巴巴集团副总裁 司罗

  • 上海交通大学计算机系教授 俞凯

  • 百度自然语言处理部主任架构师 牛正雨

  • 哈尔滨工业大学计算学部教授 车万翔

4月29日挑战赛发布暨研讨会精彩视频放送:

https://www.bilibili.com/video/BV1AR4y1P7xh?p=1

07a017dd2acb80fec16a33ef29c74845.gif

c7693e09c87e122a723217dbfe993ebc.png

7750a99fea800cde61daa62503278e67.gif

欢迎有兴趣参与本挑战赛的各位老师、同学和业界研究者扫描下方二维码,加入挑战赛微信群,以便后期接收通知和沟通讨论!

b810e5bc63b1ea9119485309b5f96810.gif

80bc807a22ac9b105fa341d5cc704144.png

7d7a02d495b169e2ae80d06488d3d7e4.gif

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值