ATIS(Automated Ticketing Information System)测试数据是在自然语言处理和语音识别领域中常用的数据集,特别是与口语理解和意图分类相关的任务。ATIS数据集最初是为了DARPA(现为DARPA)的ATIS项目而创建的,该项目旨在开发一个能够处理电话上航空旅行信息查询请求的自动化系统。
ATIS3测试数据指的是ATIS数据集的特定版本或迭代。它通常包含一系列用户提出与旅行相关请求的音频记录(例如,“我需要从波士顿飞往洛杉矶”的音频),以及这些录音的相应转录和语义标注,表示用户的意图和所请求的各种信息(例如,出发城市、目的地城市、日期等)。
ATIS3测试数据经常被用于评估各种语音识别和自然语言理解系统的性能。研究人员和开发人员可以使用这个数据集来训练他们的模型,然后在保留的测试集上测试其性能,以了解他们的系统在未见过数据上的泛化能力。
请注意,ATIS数据集只是自然语言处理和语音识别任务中可用的众多基准数据集之一。其他流行的数据集还包括Switchboard语料库、Fisher语料库等。.
获取方法:
方法1:注册LDC账号并加入组织获取数据,官网链接:LDC官网
方法2:关注公众号,回复ATIS3 Test DataLDC语料小助手https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg