Gavin老师Transformer直播课感悟 - DIET:基于Transformer的轻量级多任务NLU系统(三)

一、概述

        通过基于各种数据集以及模型组件的搭配来测试DIET架构各个组件的有效性,验证各种情况下DIET模型的表现。

二、实验数据准备

        在实验中使用了三种数据集:NLU-Benchmark数据集,ATIS数据集,SNIPS数据集。实验主要聚焦于NLU数据集,数据集主要使用了scenarios,actions, entities三类注解。

e.g. schedule a call with Lisa on Monday morning

        这句话里scenario是”calendar”, action是”set_event”, entities包括[event_name: a call with Lisa]和[date: Monday morning],那么intent label可以通过组合如”calendar_set_event”来定义。关于intent的设置是需要重点考虑的,这涉及到语言理解的粒度,重合度等方面,如果设置的耦合度较高,可能会导致模型在语言理解时出现confuse的情况。

        在实验时把NLU数据集划分为10个folds,每个fold有各自的测试对话集(utterances)。总体来说,数据集使用了64个意图和54个实体类型。

        ATIS数据集由机票预订语音记录转换的文本构成。这个训练数据集总共有21个意图和79个实体类型。

        SNIPS是通过Snips个人语音助手收集的数据,规模比NLU小了很多。这个数据集包含了7个意图和39个实体。

<
  • 15
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值