-
task-oriented dialogue system:面向任务的对话系统
-
pipeline designs:将对话系统中的不同组件和任务按照特定的顺序和流程进行组织和设计的方法
-
sequence to sequence model:将输入序列映射到输出序列,相当于一个端到端的模型和训练
-
reinforcement learning:让智能体(agent)通过与环境的交互来学习如何做出正确的决策,以最大化累积奖励。
-
text spans:指文本中的连续片段或子串。在自然语言处理中,文本通常由一个或多个字符组成,而text spans则指的是从文本中选择的一部分连续字符序列。
-
dialogue beliefs:对话信念,是指系统对话管理器(dialogue Manager)根据当前对话上下文和已经接收到的对话历史信息,对用户意图、对话状态和系统状态的估计或假设。(可以类比自编码器中的隐变量)
一组对话信念通常以槽-值(slot-value)的形式表示,其中槽(slot)是一种表示对话状态的属性,值(value)是对该属性的估计或假设。例如,在一个餐厅预订的对话系统中,可能有一个槽"food_type"表示用户想要的菜系,对应的对话信念可能是"food_type: Chinese",表示系统估计用户希望选择中国菜。
-
out of vocabulary (oov):是指在自然语言处理中遇到的一种情况,即在模型或系统训练期间或推理期间遇到了未在训练数据中出现过的词汇或标记,这些词汇可能是拼写错误、新出现的术语、专有名词等。
-
the delexicalization of belief tracker:信念跟踪器的去词汇化,指当对话系统涉及一些具体的实体或者个人信息时,为了保护用户隐私或应对未知实体,常常需要对这些信息进行去词汇化处理,即将实体或个人信息从对话内容中去除,用通用的占位符或标记来代替。