论文总结之对话生成篇2.0

8.Exploiting Persona Information for Diverse Generation of Conversational Responses
在这里插入图片描述
本模型主要特点在于中间变量z的训练,这里涉及到的数学知识见https://zhuanlan.zhihu.com/p/26898768
其他的特点,就在于用性格编码,跟情感、关键词等思想差不多。
主要有两大步:第一步即对性格文本和上下文
(1)将每一个性格文本编码成空间向量和上下文向量做softmax得到匹配权重。
然后将性格文本再做处理和匹配权重相乘累加。
最后用公式6堆叠3次u3。
(2)将上一步堆叠得到的u3和z做MLP,选择最有可能的性格向量
解码策略上也有特点,两种解码模式。
第一个:软策略
两个词表,分别是性格词表和其他词表;
通过状态编码分别计算两个词表词汇生成概率(这个跟seq2seq一样),稍微有点不一样的是这个模型还会通过公式(10)即3.3卷积后的性格向量和状态做匹配度计算,得到两个表类型的概率,然后公式(11)得到最终词汇分布。
第2个:强制策略
就是将选出来的性格,做rn

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值