The Second Conversational Intelligence Challenge (ConvAI2)

68 篇文章 2 订阅
60 篇文章 1 订阅
ConvAI2比赛推动了open-domain chatbots的最新进展,研究发现预训练Transformer模型表现最优。尽管自动评估与人类评估相关,但未来系统需考虑对话行为平衡。Hugging Face在自动评估中领先,Lost in Conversations在人工评估中夺冠。
摘要由CSDN通过智能技术生成

Abstract

我们描述了 ConvAI2 NeurIPS 比赛的设置和结果。这个比赛的目标是推进 open-domain chatbots 的 SOTA. 一些关键要点是:

  • 预训练 Transformer 变体是当前这个任务上效果最好的模型
  • 为了提升多轮对话的性能,未来的系统需要的不仅仅是单词度量指标如困惑度,还需要去度量对话序列的质量,例如重复、一致性以及对话动作的平衡(例如问了多少问题 vs. 回答了多少问题)

Overview of the competition

Conversational Intelligence Challenge 比赛的目的是创建可以进行有意义的开放领域人机对话的高质量的对话 agent. 这个任务的主要障碍是对于非任务型的对话系统,还没有建立相关的 benchmark 及 solid 的评估标准来自动化地评估对话质量。这个竞赛意在建立一个具体的场景来测试目标为让用户投入的 chatbot. 竞赛希望建立一个标准的评估工具来使得这些对话系统可以直接比较,包括开源数据集,评估代码(自动评估以及在 Mechanical Turk 上自动进行 human evaluation 的代码),模型

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值