introduction
1. 将对话行为预测看做和响应生成一样的序列生成任务
2. 同时训练对话行为和响应的生成模型
3. 损失函数使用不确定性损失,自适应调整响应生成和对话行为生成的权重
method
对话行为生成:将对话行为按照领域-意图-槽值三级结构组织,对每个token进行编码
其中Vb是belief state,随后Ha按照如下decoder的步骤生成
此处有疑惑,论文中说按照decoder的步骤生成Ha,但是decoder中没有H的生成公式,只有
introduction
1. 将对话行为预测看做和响应生成一样的序列生成任务
2. 同时训练对话行为和响应的生成模型
3. 损失函数使用不确定性损失,自适应调整响应生成和对话行为生成的权重
method
对话行为生成:将对话行为按照领域-意图-槽值三级结构组织,对每个token进行编码
其中Vb是belief state,随后Ha按照如下decoder的步骤生成
此处有疑惑,论文中说按照decoder的步骤生成Ha,但是decoder中没有H的生成公式,只有
>