Transformer解码器原理解析

最新推荐文章于 2024-06-03 16:31:33 发布

baihaisheng

最新推荐文章于 2024-06-03 16:31:33 发布

阅读量1.1k

点赞数

分类专栏： NLP 文章标签：自然语言处理

本文链接：https://blog.csdn.net/qq_41128383/article/details/105729576

版权

NLP 专栏收录该内容

88 篇文章 3 订阅

订阅专栏

Transformer解码器原理
在这里插入图片描述
解码器层

import torch
import torch.nn as nn
class DecoderLayer(nn.Module):
        def __init__(self,size,self_attn,src_attn,dropout):
                super().__init__()
                self.size=size
                self.self_attn=self_attn
                self.src_attn=src_attn
                self.feed_forward=feed_forward
                self.sublayer=clones(SubLayerconnection(),3)

        forward(input,memory,source_mask,target_mask):
                m=memory
                input=self.sublayer[0](input,lambda input:self.self_attn(input,input,input,target_mask)
                input=self.sublayer[1](input,lambda input:self.src_attn(input,m,m,source_target)
                return self.sublayer[2](input,self.feed_forward)


dl = DecoderLayer(size, self_attn, src_attn, ff, dropout)
dl_result = dl(x, memory, source_mask, target_mask)

解码器

class Decoder(nn.Module):
        def __init__(self,layer,N):
                super().__init__()
                self.layers=clones(layer,N)
                self.norm=NormLayer(layer.size)

        def forward(self,input,memory,source_mask,target_mask):
                for layer in self.layers:

                        input=layer(input,memory,source_mask,target_mask)
                return self.norm(input)

c=copy.deepcopy
attn=MultiHeadedAttention(head,d_model)
feed_forward=PositionalwisefeedForward(d_model,d_ff,dropout)

layer=DecoderLayer(size,c(attn),c(attn),c(feed_forward),dropout)
de=Decoder(layer,N)

output_de=de(input,memory,source_mask,target_mask)

baihaisheng

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Transformer解码器原理解析

Transformer解码器原理解码器层import torchimport torch.nn as nnclass DecoderLayer(nn.Module): def __init__(self,size,self_attn,src_attn,dropout): super().__init__() ...
复制链接

扫一扫