SereTOD2022 Track1代码剖析-面向半监督和强化学习的任务型对话系统挑战赛

AIMasterStar

已于 2022-07-25 18:34:54 修改

阅读量361

点赞数

分类专栏：智能语音对话与AI大模型文章标签：人工智能深度学习神经网络自然语言处理

于 2022-07-25 18:34:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AIMasterStar/article/details/125745239

版权

智能语音对话与AI大模型专栏收录该内容

17 篇文章 25 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

本文详细剖析SereTOD2022挑战赛Track1的基准方法与实现代码，涵盖实体抽取、实体指代、槽值抽取和实体槽对齐四个模块，基于BERT的序列标注模型。数据集包含8975个对话，任务旨在提升任务型对话系统的半监督和强化学习能力。

摘要由CSDN通过智能技术生成

SereTOD2022挑战赛是清华大学欧智坚老师团队和中移动冯俊兰老师一同举办的，附属在EMNLP2022的面向半监督和强化学习的任务型对话系统研讨会。该数据集面向真实业务场景，口语对话转录，复杂度极高，挑战赛公开的数据意义重大，基准代码的NLU基于BERT实现，NLG基于GPT2实现，有较好的学习价值。因此，我们在此详细剖析一下该挑战赛Track1的基准方法与实现代码。关于任务设置和数据标注规则可参见另外一篇博文。

GITHUB代码库：https://github.com/SereTOD/SereTOD2022

目录

0. 数据分析：

0.1 数据统计

1. Track1赛道：面向对话数据进行信息抽取

1.1 基准方法

1.2 实体抽取代码实现

1.2.1 实体类型

1.2.2 模型结构

1.2.3 输入输出

1.3 实体指代代码实现

1.3.1 任务描述

1.3.2 模型结构

1.3.3 输入输出

1.4 槽值抽取代码实现

1.4.1 语义槽类型

1.4.2 模型结构

1.4.3 输入输出

1.5 实体槽对齐代码实现

1.5.1 任务描述

1.5.2 模型结构

1.5.3 输入输出

1.6 Track1的性能评估

1.6.1 获取对话的实体和三元组

1.6.2 实体和三元组F1值评估

1.6.3 最终数据提交格式

0. 数据分析：

0.1 数据统计

有标注数据：一共有8975个对话，其中，客服在前: 8894 用户在前: 59 其他情况: 22。对话轮回一共100139次，其中&#

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
SereTOD2022 Track1代码剖析-面向半监督和强化学习的任务型对话系统挑战赛

SereTOD2022挑战赛是清华大学欧智坚老师团队和中移动冯俊兰老师一同举办的，附属在。该数据集面向真实业务场景，口语对话转录，复杂度极高，挑战赛公开的数据意义重大，基准代码的NLU基于BERT实现，NLG基于GPT2实现，有较好的学习价值。因此，我们在此详细剖析一下该挑战赛Track1的基准方法与实现代码。......
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AIMasterStar 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。