pytorh-transformer

最新推荐文章于 2022-08-30 19:25:01 发布

小猪猪爱吃饭

最新推荐文章于 2022-08-30 19:25:01 发布

阅读量238

点赞数

分类专栏：小猪猪的实习学习笔记小猪猪的深度学习之路文章标签：深度学习 pytorch

本文链接：https://blog.csdn.net/weixin_45639117/article/details/113700406

版权

torch.nn.Transformer

torch.nn.Transformer(d_model: int = 512, nhead: int = 8, num_encoder_layers: int = 6, num_decoder_layers: int = 6, dim_feedforward: int = 2048, dropout: float = 0.1, activation: str = 'relu', custom_encoder: Optional[Any] = None, custom_decoder: Optional[Any] = None)

参数：

d_model –编码器/解码器输入大小（默认 512）。
nhead –多头注意力模型的头数（默认为8）。
num_encoder_layers –编码器中子编码器层的数量（默认为6）。
num_decoder_layers –解码器中子解码器层的数量（默认为6）。
dim_feedforward –前馈网络模型的中间层维度（默认= 2048）。
dropout –默认值= 0.1。
activation–编码器/解码器中间层的激活函数，relu或gelu（默认值= relu）。
custom_encoder –自定义编码器

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小猪猪爱吃饭

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pytorh-transformer

torch.nn.Transformertorch.nn.Transformer(d_model: int = 512, nhead: int = 8, num_encoder_layers: int = 6, num_decoder_layers: int = 6, dim_feedforward: int = 2048, dropout: float = 0.1, activation: str = 'relu', custom_encoder: Optional[Any] = None, custo
复制链接

扫一扫