1.NLP Service APIs and Models for Efficient Registration of New Clients
题目:用于高效注册新客户的NLP服务API和模型
链接:学术范
摘要:最先进的NLP推理使用了大量的神经架构和经过gpu数月训练的模型,远远超出了大多数NLP用户的能力范围。这导致了大型人工智能公司的通用的基于api的公共NLP服务模式,为大量客户提供服务。无论是(硬件不足的)客户端还是(大量订阅的)服务器都无法负担传统的微调。许多客户拥有很少或没有标记的数据。我们开始研究如何将集中式NLP服务适应于客户,并提出了一种实用且轻量级的方法。每个客户机使用无监督的、基于语料库的草图注册到服务。服务器使用一个辅助网络将草图映射到一个抽象的向量表示,然后通知主标注网络。当一个新客户用它的草图注册时,它可以立即获得准确性的好处。我们使用情感标记、NER和预测语言建模来证明所提出的架构是成功的。
2.Improving Device Directedness Classification of Utterances with Semantic Lexical Features
题目:改进具有语义词汇特征的话语的设备定向分类
摘要:用户与Alexa、GoogleHome和Siri等个人助理的交互通常是由唤醒词或唤醒词启动的。一些个人助理有“跟进”模式,允许用户在不需要唤醒词的情况下进行额外的互动。为了让系统只在适当的时候做出反应,并忽略非它想要的声音,声音必须被分为设备导向的和非设备导向的。目前最先进的系统主要使用声学特征来完成这项任务,而其他的系统只使用词汇特征或添加了基于lm的