论文阅读-End-to-End Trainable System for Enhancing Diversity in Natural Language Generation

最新推荐文章于 2022-10-19 23:43:36 发布

夏殇0808

最新推荐文章于 2022-10-19 23:43:36 发布

阅读量201

点赞数

分类专栏： NLG 学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012328476/article/details/109047059

版权

文章目录

背景

出发点：

End-to-end 模型可以将句子规划和实现两步合为一步
现有的方法生成的句子开头大多是相同的

创新点：

基于Semantically Conditioned Long Short-Term Memory（SC-LSTM）模型的改进：

增加了一个semantic rerank 的处理过程，并将这个过程的loss 加入SC-LSTM整体loss进行优化
对输出句子的第一个词进行控制：在输入时将第一个词的信息单独作为一个特征输入模型

SC-LSTM

SC-LSTM, 引入对话行为的 one-hot 主题向量覆盖机制, 使生成的文本包含特定的主题信息。

考虑到输入的MR中，属性是可以枚举的，所以，用one-hot对MR进行向量表示 $d_0$ 。这其实是一个sentence planner，因为保证了哪些属性要在最后的文本中生成。用 $w_{t} \in \mathbb{R}^{M}$ 表示 $t$ 时刻的输入向量， $d_{t} \in \mathbb{R}^{D}$ 表示 $t$ 时刻的MR向量， $N$ 表示SC-LSTM的单元数，那么前向传播过程如下：

$\left(\begin{array}{l} i_{t} \\ f_{t} \\ o_{t} \\ r_{t} \\ g_{t} \end{array}\right)=\left(\begin{array}{c} \sigma \\ \sigma \\ \sigma \\ \sigma \\ \tanh \end{array}\right) \mathbf{W}_{5 n, 2 n}\left(\begin{array}{c} w_{t} \\ h_{t-1} \end{array}\right)$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。