SereTOD2022 Track2代码剖析-面向半监督和强化学习的任务型对话系统挑战赛

本文详细剖析SereTOD2022挑战赛Track2的基准方法和实现,涵盖数据预处理、模型结构、训练与预测流程,以及评估方法。任务涉及构建基于半监督和强化学习的对话系统,使用BERT和GPT2作为NLU和NLG的基础,并通过序列化对话轮决策进行建模。
摘要由CSDN通过智能技术生成

 SereTOD2022挑战赛是清华大学欧智坚老师团队和中移动冯俊兰老师一同举办的,附属在EMNLP2022的面向半监督和强化学习的任务型对话系统研讨会。该数据集面向真实业务场景,口语对话转录,复杂度极高,挑战赛公开的数据意义重大,基准代码的NLU基于BERT实现,NLG基于GPT2实现,有较好的学习价值。因此,我们在此详细剖析一下该挑战赛Track2的基准方法与实现代码。关于任务设置和数据标注规则可参见另外一篇博文

GITHUB代码库:https://github.com/SereTOD/SereTOD2022

目录

0. 数据分析:

0.1 数据统计

1. Track2赛道:构建任务型对话系统

1.1 数据预处理

2.2 任务描述

2.3 对话序列化

2.3.1 训练验证测试划分

2.3.2 检索本地知识库

2.3.3 序列化对话轮决策

2.4 模型结构

2.5 模型训练

2.6 模型预测

2.6.1 首先预测当前对话轮提及到的实体

2.6.2 然后预测当前对话轮的用户意图并构建局部知识库查询结果

2.6.3 其次预测当前轮客服意图

2.6.4 最后预测当前轮客服响应文本

2.7 评估方法


0. 数据分析:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AIMasterStar

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值