EMNLP 2022半监督和强化对话系统挑战赛持续火热报名中，7月1日截止

智源社区

于 2022-06-21 18:00:09 发布

阅读量818

点赞数

文章标签：人工智能大数据强化学习机器学习自然语言处理

原文链接：https://mp.weixin.qq.com/s?__biz=MzU5ODg0MTAwMw==&mid=2247526743&idx=2&sn=b0e854cd8a0a1a80dbcca13a89268b4c&chksm=febc2a93c9cba3852076da69bc36453248f3a4f2c1f0c94ccf8eeb4821582590daf9062bb400&scene=126&&sessionid=0

版权

EMNLP是由国际语言学会（ACL）主办的自然语言处理领域的顶级国际会议。特定主题的研讨会（Workshop）是 EMNLP 大会议程的精彩部分，每年从全球学者的提案（Proposal）中遴选。EMNLP 2022 Workshop Proposal 竞争激烈，在 EMNLP 官方公布的 2022 Workshop Proposal 收录结果中，由清华大学和中国移动联合承办的 SereTOD Workshop “Towards Semi-Supervised and Reinforced Task-Oriented Dialog Systems” 及相关挑战赛 SereTOD Challenge 名列其中。

赛事背景

自然语言对话交互是人工智能的核心技术，对未来智能化社会和经济的发展起着重要作用。目前人机对话系统严重依赖人工规则和标注，制约跨领域规模化应用。各类半监督和强化方法及其在对话系统中的应用，孕育着重要的技术发展趋势，也面临诸多挑战。本次SereTOD研讨会及挑战赛，旨在促进国际上相关学者的交流合作，推动人工智能对话核心技术的未来发展。

“EMNLP2022 半监督和强化对话系统挑战赛”，由清华大学和中国移动共同发起，已于2022年4月29日正式上线启动，目前正在面向全球接受报名，并即将于2022年7月1日截止报名。

赛事亮点

SereTOD 挑战赛基于中国移动客服对话数据（Mobile Customer-Service Dialog，MCSD），具有以下鲜明特点：

首个十万量级人人对话数据集

MCSD数据集来源于现实世界的真实对话场景，包含数据安全过滤后近十万通用户与运营商客服间的咨询类对话日志，是迄今为止首个十万量级面向任务的多领域公开人人对话数据集，为促进对话大模型、口语化人人对话系统、数据驱动的体系化对话分析等研究目标提供有力的数据支撑。

助力人机对话模型及研究范式突破

目前的人工智能技术过度依赖有监督学习和高成本人工标注，泛化性不足，领域知识难以有效利用。各类半监督和强化方法，包括预训练 (pre-training)、自训练 (self-training)、自监督 (self-supervised)、弱监督 (weakly-supervised)、零样本/少样本迁移学习 (transfer learning for zero-shot or few-shots)、隐变量建模 (latent-variable modeling)、领域自适应 (domain adaptation)、数据增强 (data augmentation)、强化学习 (reinforcement learning) 等，孕育着重要的技术发展趋势。本次公开的MCSD数据集不仅服务于竞赛任务，更有助于人机对话模型的创新及研究范式的突破。

双赛道竞赛任务面向实际需求

本挑战赛聚焦半监督和强化对话系统，不仅关注任务相关知识的抽取——对话数据的信息抽取；还关注对话系统本身的构建——客服场景任务型对话系统的构建。

赛事规则

SereTOD挑战赛具体分为两条赛道。组委会将提供约 10,000 通标注语料和 90,000 通未标注语料，以及两个赛道的基线系统。

赛道一（Track 1）

基于对话数据的信息抽取

此赛道包括实体抽取和槽值填充。在真实客服对话中实体以不同的表示形式被提及，如何准确提取实体及槽值，是建立对话系统知识库的重要步骤。

赛道二（Track 2）

任务型对话系统构建

此赛道要求构建一个客服场景的任务型对话系统，进行基于测试语料的离线客观评估和人工交互式评估。

报名通道

登录挑战赛官网：http://seretod.org/Challenge.html

下载并填写报名表。将填写完毕的报名表发送到邮箱seretod2022@gmail.com，报名截止日期为2022年7月1日。

每个赛道得分排名前三的队伍将会获得奖金和荣誉证书。得分排名靠前的队伍，将优先邀请投稿到 EMNLP 2022 Workshop，接收的论文将收入 EMNLP 论文集。

冠军：20,000现金奖励，颁发荣誉证书
亚军：15,000现金奖励，颁发荣誉证书
季军：10,000现金奖励，颁发荣誉证书

赛事时间节点

日期	详细安排
7月1日	挑战赛报名截止
7月1日	训练数据发布
8月14日	评估数据发布
8月21日	最终提交截止
8月31日	评估结果发布
9月7日	Workshop 论文提交截止
12月7日	Workshop 举办暨挑战赛颁奖

SereTOD挑战赛组委会

欧智坚清华大学
冯俊兰中国移动
李涓子清华大学
李亚坤清华大学
刘一红清华大学
彭一皓清华大学
黄一毅中国移动
赵江江中国移动

EMNLP2022 SereTOD Workshop官网

http://seretod.org

4月29日挑战赛发布暨研讨会，邀请了领域内顶尖学者分享人工智能对话系统技术前沿，探讨构建半监督和强化对话系统面临的挑战，共同推动该领域的发展。研讨会由清华大学电子工程系欧智坚教授和中国移动研究院首席科学家冯俊兰博士主持，嘉宾包括：

京东集团技术副总裁 何晓东
阿里巴巴集团副总裁司罗
上海交通大学计算机系教授俞凯
百度自然语言处理部主任架构师 牛正雨
哈尔滨工业大学计算学部教授 车万翔

4月29日挑战赛发布暨研讨会精彩视频放送：

https://www.bilibili.com/video/BV1AR4y1P7xh?p=1

欢迎有兴趣参与本挑战赛的各位老师、同学和业界研究者扫描下方二维码，加入挑战赛微信群，以便后期接收通知和沟通讨论！

智源社区

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
EMNLP 2022半监督和强化对话系统挑战赛持续火热报名中，7月1日截止

EMNLP是由国际语言学会（ACL）主办的自然语言处理领域的顶级国际会议。特定主题的研讨会（Workshop）是 EMNLP 大会议程的精彩部分，每年从全球学者的提案（Proposal）中遴选。EMNLP 2022 Workshop Proposal 竞争激烈，在 EMNLP 官方公布的 2022 Workshop Proposal 收录结果中，由清华大学和中国移动联合承...
复制链接

扫一扫