Transformer 介绍

Transformer 

论文:https://arxiv.org/abs/1706.03762

代码解析:https://blog.csdn.net/mijiaoxiaosan/article/details/74909076

https://baijiahao.baidu.com/s?id=1622064575970777188&wfr=spider&for=pc

https://www.jianshu.com/p/e7d8caa13b21

https://zhuanlan.zhihu.com/p/44121378

 

Attention 机制

 

Encoder-Decoder

https://blog.csdn.net/qq_38906523/article/details/79838000

那么seq2seq又是什么呢?简单的说,就是根据一个输入序列x,来生成另一个输出序列y。seq2seq有很多的应用,例如翻译,文档摘取,问答系统等等。在翻译中,输入序列是待翻译的文本,输出序列是翻译后的文本;在问答系统中,输入序列是提出的问题,而输出序列是答案。

为了解决seq2seq问题,有人提出了encoder-decoder模型,也就是编码-解码模型。所谓编码,就是将输入序列转化成一个固定长度的向量;解码,就是将之前生成的固定向量再转化成输出序列。 

https://www.jianshu.com/p/bbba110b5023

https://www.cnblogs.com/wdmx/p/10280753.html

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值