Seq2Seq模型中的标签

最新推荐文章于 2022-11-30 21:13:31 发布

I am zzxn

最新推荐文章于 2022-11-30 21:13:31 发布

阅读量720

点赞数 1

分类专栏： NLP 机器学习文章标签： nlp 自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39438086/article/details/109393046

版权

seq2seq模型一般由一个编码器和一个解码器组成。编码器将token的embedding序列编码成分布式表示（可能是向量序列或者一两个单独的语义向量），然后解码器根据编码器的结果生成出一个向量的序列。解码器生成的向量序列根据下游任务的不同有不同的利用方式。

**在使用seq2seq模型时，由于一些原因我们需要添加一些特殊的标签，或者叫dummy token，用来表示序列开始、序列结束、句子/段落的开始结束等等。**下面举例说明。

假设某seq2seq模型被用作英中翻译，且我们的样本是这样的：

x: "I love you."
y: "我爱你。"

那么编码器的输入应当是下列序列的embedding：

<SOS> i love you . <EOS>

这里<SOS>代表序列开始（Start Of Sequence），<EOS>代表序列结束（End Of Sequence），用什么符号表示并不重要，只要你喜欢并且它不在原始文本中就可以了。对于输入序列，开始标签可有可无，比较重要的标签是<EOS>。因为我们希望编码器通过看到结束标签来意识到输入序列已经结束，使得它输出整个输入的分布式表示。如果没有结束标签，可能编码器输出的向量更多地包含最后一个词附近局部的信息，而不是全局的信息。

解码器的输入应当是下列序列的embedding（假设我们用teacher forcing的方式）：

<SO

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Seq2Seq模型中的标签

seq2seq模型一般由一个编码器和一个解码器组成。编码器将token的embedding序列编码成分布式表示（可能是向量序列或者一两个单独的语义向量），然后解码器根据编码器的结果生成出一个向量的序列。解码器生成的向量序列根据下游任务的不同有不同的利用方式。**在使用seq2seq模型时，由于一些原因我们需要添加一些特殊的标签，或者叫dummy token，用来表示序列开始、序列结束、句子/段落的开始结束等等。**下面举例说明。假设某seq2seq模型被用作英中翻译，且我们的样本是这样的：x: "I
复制链接

扫一扫

专栏目录

I am zzxn CSDN认证博客专家 CSDN认证企业博客

码龄7年

47: 原创

32万+: 周排名

106万+: 总排名

9万+: 访问

: 等级

1079: 积分

13: 粉丝

84: 获赞

38: 评论

267: 收藏

私信

关注

热门文章

分类专栏

杂项 15篇
机器学习 9篇
NLP 3篇
Java 3篇
人生感悟 1篇
算法 14篇
Angular
系统 4篇
Spring 2篇
HTML5 1篇
WebGL

最新评论

（多头）自注意力机制的PyTorch实现
剛田武: 正常的话x输入不应该是（batch_size,dim,length）吗？代码里写的顺序不太一样不过这个倒无所谓就是得变下输入顺序
（多头）自注意力机制的PyTorch实现
希望自己能一直努力: 单独算也没有区别吧
（多头）自注意力机制的PyTorch实现
We are: 请问这个dim_in具体指的是什么那？是每个样本的特征维度嘛？
（多头）自注意力机制的PyTorch实现
studyga1: 您好，咨询一下。torch.matmul(q, k.transpose(2, 3)) * self._norm_fact 是q与每一个k相乘吗？
（多头）自注意力机制的PyTorch实现
studyga1: 我也是才学，应该传的都是同样的值，应该就是d_model吧，然后在forward函数里d_model// num_head了就变成DK,DV,DQ了。d_model就是你要传入的变量的最后一个维度。有什么不对的可以指正，谢谢。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。