NLP学习笔记：seq2seq

最新推荐文章于 2023-06-07 17:56:46 发布

冲冲冲@chong

最新推荐文章于 2023-06-07 17:56:46 发布

阅读量158

点赞数

分类专栏：笔记文章标签：自然语言处理学习深度学习

本文链接：https://blog.csdn.net/m0_57190374/article/details/128948385

版权

笔记专栏收录该内容

16 篇文章 0 订阅

订阅专栏

1 基于RNN生成文本，seq2seq(从一个时序到另一个时序的神经网络)。
2 语言模型：根据已经出现的单词输出下一个出现的单词的概率分布。

3 如何生成下一个新单词：选择概率分布中概率最高的单词（确定性方法）；根据概率分布进行概率性的选择（概率性的方法）。

4 步骤：生成单词的语言模型-->获得单词的概率分布-->根据概率分布采样下一个出现的单词
5 seq2seq:又称 Encoder Decoder model 。

6 seq2seq改进：反转输入数据（直观的认为反转数据后反向传播梯度更加平滑）。

7 seq2seq改进：Peeky（偷窥）,将编码器输出的隐藏状态信息h分配给解码器所有的LSTM和Affine层，加入Peeky后模型参数增加带来计算量的负担。

8 seq2seq的应用：机器翻译、自动摘要、问答系统、邮件自动回复、图像自动描述等。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

冲冲冲@chong

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

『NLP学习笔记』Seq2Seq机器翻译

AI新视界

05-03

916

Seq2Seq机器翻译

NLP-生成模型-2014：Seq2Seq+Attention（首次：利用QKV从大量信息中抽取对任务重要的信息；抽取文档中重要的句子；抽取句子中重要的单词）【案例：AttentionNMT用于翻译】

u013250861的博客

04-08

989

《原始论文：Neural Machine Translation by Jointly Learning to Align and Translate》：第一篇将Attention用于Seq2Seq模型的文献。Attention机制：从Encoder的输入序列的很多信息中根据当前时间步Decoder的状态选出“解码任务所需要的信息”。在普通的RNN结构中，Encoder需要把一个句子转化为一个向量，然后在Decoder中使用，这就要求Encoder把源句子中所有的信息都包含进去，但是当句子长度过长的时候，这

参与评论您还未登录，请先登录后发表或查看评论

NLP算法（四）- seq2seq

anycall201的博客

12-28

414

1 背景 RNN模型虽然能够将语义信息在序列间传递，但其输入和输出长度必须相同。因此RNN模型在解决如：机器翻译、摘要生成等问题时比较束手无策。因此在这基础上，Seq2Seq模型被提出，用以解决这种由一个序列产生另一个序列的问题。 2 模型结构 Seq2Seq模型包含两个部分，编码器(Encoder) 和解码器(Decoder)。与RNN结构不同的是，Seq2Seq结构不再要求输入和输出序列有相同的时间长度。 Encoder把所有的输入序列都编码成一个统一的语义向量Context，然后再由Decode

自然语言处理-应用场景-文本生成：Seq2Seq --＞自动摘要【Document--＞Summary】

u013250861的博客

02-01

939

人工智能-自然语言处理(NLP)-应用案例：自动摘要（Text Summarization）

在seq2seq中玩文章摘要预处理数据（NLP）

weixin_42108215的博客

07-08

2482

数据预处理：import pandas as pd import numpy as np import tensorflow as tf import re from nltk.corpus import stopwords import time from tensorflow.python.layers.core import Dense from tensorflow.python.ops....

NLP学习—12.Seq2Seq模型与Attention机制

柳杰的博客

08-21

1130

文章目录引言一、文本生成任务二、Seq2Seq讲解1.Seq2Seq模型存在问题三、Beam Search四、Seq2Seq+Attention机制引言 Seq2Seq模型用于文本生成。在这个模型基础上，加上Attention机制可以使得模型效果更好。一、文本生成任务常见的文本生成任务有以下几种： Machine Translation（机器翻译）不同语言之间的转换 Summarization（自动生成摘要）有两种方法论：抽取式摘要生成将原始文本中关键的句子、短语、关键单词抽

NLP教程笔记：Seq2Seq 语言生成模型

nanke_4869的博客

02-05

1874

NLP教程 TF_IDF 词向量句向量 Seq2Seq 语言生成模型目录NLP教程什么是Encoder和Decoder翻译秀代码还能优化吗总结全部代码机器怎么理解句子一直是一个难题，以前有人尝试用句子中出现的词语频率来表达这个句子的含义（TF-IDF）。也有人想把句子中的词语先向量化，然后再叠加句子中所有向量化的词语来表达一句话。这些的确都是一种计算机表达句子含义的方式，但是不一定会非常准确。因为他们都只是一种对词语理解的简单加工方式，有的忽略了词语的表达顺序，有的忽略了词语的组合模式。这往往

Seq2seq模型、机器翻译学习笔记

01-07

Seq2seq模型当输入和输出都是不定长序列时，可以使⽤编码器—解码器（encoder-decoder）或者seq2seq模型。这两个模型本质上都⽤到了两个循环神经⽹络，分别叫做编码器和解码器。编码器⽤来分析输⼊序列，解码器⽤...

NLP 学习笔记之 Seq2seq

weixin_41147129的博客

03-09

2017

一什么是word embedding 词嵌入（Word Embedding）或者分布式向量（Distributional Vectors）是将自然语言表示的单词转换为计算机能够理解的向量或矩阵形式的技术。由于要考虑多种因素比如词的语义（同义词近义词）、语料中词之间的关系（上下文）和向量的维度（处理复杂度）等等，我们希望近义词或者表示同类事物的单词之间的距离可以理想地近，只有拿到很理想的单词表示形式，我们才更容易地去做翻译、问答、信息抽取等进一步的工作。在Word Embedding之前，常用的方法有on

深度学习笔记之Seq2Seq(一)基本介绍

最新发布

静静的学习就好

06-07

1103

从本节开始，将介绍Seq2seq。

NLP之基于Seq2Seq的单词翻译

CJK's Blog

09-12

478

在RNN模型需要解决的问题中，有一类M to N的问题，即输入输出不等长问题,例如机器翻译和生成概述。这种结构又叫做，或者叫。

文本生成(一)---Seq2Seq理论笔记

weixin_45259896的博客

05-07

741

文本生成（一） --- Seq2Seq结构训练解码历史杂记：参考结构 1.seq2seq结构，又称encoder-decoder结构。训练 2.根据标准答案来decode的方式为「teacher forcing」，而根据上一步的输出作为下一步输入的decode方式为「free running」。 3.teacher forcing，这种操作的目的就是为了使得训练过程更容易。 4.「计划采样」（scheduled sampling），我们设置一个概率p，每一步，以概率p靠自己上一步的输入来预测，

文本生成seq2seq框架

null的专栏

04-13

987

1. 概述之前在工作中用到BERT算法，对其中的Attention机制追根溯源发现，NLP中比较早提出使用Attention机制是在Seq2Seq框架中。Seq2Seq是Sequence to Sequence的缩写，在Seq2Seq中包含了一个encoder模块和一个decoder模块。这种同时包含encoder和decoder的结构不禁让笔者回忆起最初学习深度学习时的一个模型——AutoEncoder，AutoEncoder模型是将输入通过encoder的网络生成中间的结果，并通过decoder对中间

seq2seq

shichaog的专栏

06-12

3384

seq2seq是通用编码器-解码器框架（encoder-decoder framework），可以用在机器翻译，文本摘要，会话建模，图像描述。源码https://github.com/google/seq2seq tensorflow 中的实现代码如下： tensorflow/tensorflow/python/ops/seq2seq.py基本模型基于论文https://arxiv.org/pd

(一)自然语言处理论文:seq2seq方法解析

天然玩家的博客

05-19

691

论文传送门：Sequence to Sequence Learningwith Neural Networks

《深度学习进阶 自然语言处理》第七章：seq2seq介绍

sherwinzhang的博客

11-21

2021

seq2seq 是 "(from) sequence to sequence"（从时序到时序）的意思，即将一个时序数据转换为另一个时序数据。本章我们将看到，通过组合两个 RNN，可以轻松实现 seq2seq。seq2seq 可以应用于多个方向，比如机器翻译、聊天机器人和邮件自动回复等。

cannot import name ‘TorchLoaderIter‘ from ‘fastNLP‘

qq_47682420的博客

04-04

626

有可能是fastNLP版本太老或者太新的问题。若升级无效，则降低版本。

小黑fastNLP成长日记3:model与callback

qq_37418807的博客

01-02

794

1.使用torch定义模型 # 使用torch版本 import torch import torch.nn as nn class LSTMText(nn.Module): def __init__(self,vocab_size,embedding_dim,output_dim,hidden_dim = 64,num_layers = 2,dropout = 0.5): super(LSTMText,self).__init__() self.embedding

深度学习笔记：机器翻译详解(注意力机制+Seq2seq&Transformer)

机器翻译是一种自然语言处理任务，目标是将一段文本从一种语言自动转换成另一种语言，利用神经网络技术解决这一问题，即神经机器翻译（NMT）。NMT的主要特点是输出是一个完整的单词序列，而非逐词翻译，这使得模型...