8.Exploiting Persona Information for Diverse Generation of Conversational Responses
本模型主要特点在于中间变量z的训练,这里涉及到的数学知识见https://zhuanlan.zhihu.com/p/26898768
其他的特点,就在于用性格编码,跟情感、关键词等思想差不多。
主要有两大步:第一步即对性格文本和上下文
(1)将每一个性格文本编码成空间向量和上下文向量做softmax得到匹配权重。
然后将性格文本再做处理和匹配权重相乘累加。
最后用公式6堆叠3次u3。
(2)将上一步堆叠得到的u3和z做MLP,选择最有可能的性格向量
解码策略上也有特点,两种解码模式。
第一个:软策略
两个词表,分别是性格词表和其他词表;
通过状态编码分别计算两个词表词汇生成概率(这个跟seq2seq一样),稍微有点不一样的是这个模型还会通过公式(10)即3.3卷积后的性格向量和状态做匹配度计算,得到两个表类型的概率,然后公式(11)得到最终词汇分布。
第2个:强制策略
就是将选出来的性格,做rn
论文总结之对话生成篇2.0
最新推荐文章于 2022-10-20 22:12:35 发布