本文继续围绕下面这篇论文来解析基于开放领域的对话机器人对话内容生成机制及训练解析等内容。
五、训练目标
4. 使用unlikelihood对生成模型进行训练
解决模型生成内容失败的一种方式是改变损失计算函数(loss function),运用下面这种unlikelihood loss计算函数来帮助修复在跨不同维度的人与模型对话概率分布之间的不匹配的状况,目的是降低内容重复和减轻词库中的tokens过度使用的问题。通过这个公式来对过度使用的tokens集合施加“惩罚”影响:
本文继续围绕下面这篇论文来解析基于开放领域的对话机器人对话内容生成机制及训练解析等内容。
五、训练目标
4. 使用unlikelihood对生成模型进行训练
解决模型生成内容失败的一种方式是改变损失计算函数(loss function),运用下面这种unlikelihood loss计算函数来帮助修复在跨不同维度的人与模型对话概率分布之间的不匹配的状况,目的是降低内容重复和减轻词库中的tokens过度使用的问题。通过这个公式来对过度使用的tokens集合施加“惩罚”影响: