SereTOD2022 Track1代码剖析-面向半监督和强化学习的任务型对话系统挑战赛

本文详细剖析SereTOD2022挑战赛Track1的基准方法与实现代码,涵盖实体抽取、实体指代、槽值抽取和实体槽对齐四个模块,基于BERT的序列标注模型。数据集包含8975个对话,任务旨在提升任务型对话系统的半监督和强化学习能力。
摘要由CSDN通过智能技术生成

SereTOD2022挑战赛是清华大学欧智坚老师团队和中移动冯俊兰老师一同举办的,附属在EMNLP2022的面向半监督和强化学习的任务型对话系统研讨会。该数据集面向真实业务场景,口语对话转录,复杂度极高,挑战赛公开的数据意义重大,基准代码的NLU基于BERT实现,NLG基于GPT2实现,有较好的学习价值。因此,我们在此详细剖析一下该挑战赛Track1的基准方法与实现代码。关于任务设置和数据标注规则可参见另外一篇博文

GITHUB代码库:https://github.com/SereTOD/SereTOD2022

目录

0. 数据分析:

0.1 数据统计

1. Track1赛道:面向对话数据进行信息抽取

1.1 基准方法

1.2 实体抽取代码实现

1.2.1 实体类型

1.2.2 模型结构

1.2.3 输入输出

1.3 实体指代代码实现

1.3.1 任务描述

1.3.2 模型结构

1.3.3 输入输出

1.4 槽值抽取代码实现

1.4.1 语义槽类型

1.4.2 模型结构

1.4.3 输入输出

1.5 实体槽对齐代码实现

1.5.1 任务描述

1.5.2 模型结构

1.5.3 输入输出

1.6 Track1的性能评估

1.6.1 获取对话的实体和三元组

1.6.2 实体和三元组F1值评估

1.6.3 最终数据提交格式


0. 数据分析:

0.1 数据统计

有标注数据:一共有8975个对话,其中,客服在前: 8894 用户在前: 59 其他情况: 22。对话轮回一共100139次,其中&#

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AIMasterStar

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值