NLP-序列生成

序列生成问题概述

序列生成问题:

  • 机器翻译问题
  • 文本摘要
  • 对话系统

序列生成方式:
- (条件)自回归序列生成:根据输入的内容X和Y历史序列预测序列中的下一个值的生成
- 自编码生成:利用让输出值等于输入值的神经网络经反向传播算法将输入压缩成潜在空间表征,然后将这种表征重构为输出。常用于数据的降维和去噪。

深度学习中建模序列生成方法:端到端方式将一个序列化数据映射成另一个序列化数据。(Seq2Seq模型)。主要基于Encoder-Decoder框架实现。

在这里插入图片描述

生成式-序列生成模型

基本RNN

在这里插入图片描述在这里插入图片描述

曝光误差(exposure bias)
https://blog.csdn.net/qq_41475067/article/details/117251469

RNN+Attention

在这里插入图片描述

Transformer

全部采用Attention机制,克服了RNN无法并行计算的缺点,可以高速并行,训练速度快
模型结构:

  • 编码端:6层Attention堆叠
  • 解码端:6层Attention堆叠
  • 交叉注意力部分:解码端的每一层与编码端的最后层做cross-attention

选择式-序列生成模型

指针网络

选择-生成式序列生成模型

指针网和生成网结合,构建可生成也可将输入序列中的词拷贝到输出中的选择-生成式网络

评价指标

正确率P:测试结果中正确切分的个数占系统所有输出结果的比例
召回率R:测试结果中正确结果的个数占标准答案总数的比例

BLEU:衡量模型生成序列和参考序列之间的N元词组的重合度

RGOUGE:最早用于文本摘要领域

存在问题

曝光偏差问题

  • 解决方法:Scheduled Sampling

训练-评价目标不一致问题

  • 解决方法:采用强化学习的策略进行模型训练
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值