Multi-Head Self-Attention

最新推荐文章于 2023-11-18 22:17:14 发布

dywvv

最新推荐文章于 2023-11-18 22:17:14 发布

阅读量352

点赞数

分类专栏：深度强化学习文章标签： pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45704823/article/details/130151426

版权

import torch
import torch.nn as nn
import torch.nn.functional as F
import math

class MultiHeadSelfAttention(nn.Module):
    def __init__(self, d_model, num_heads):
        super(MultiHeadSelfAttention, self).__init__()
        assert d_model % num_heads == 0, "d_model must be divisible by num_heads"

        self.d_model = d_model
        self.num_heads = num_heads
        self.head_dim = d_model // num_heads

        self.W_Q = nn.Linear(d_model, d_model)
        self.W_K = nn.Linear(d_model, d_model)
        self.W_V = nn.Linear(d_model, d_model)

        self.W_O = nn.Linear(d_model, d_model)

    def forward(self, x):
        batch_size, seq_len, _ = x.size()

        Q = self.W_Q(x).view(batch_size, seq_len, self.num_heads,        self.head_dim).transpose(1, 2)
        K = self.W_K(x).view(batch_size, seq_len, self.num_heads, self.head_dim).transpose(1, 2)
        V = self.W_V(x).view(b

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
Multi-Head Self-Attention

在示例的最后部分，我们创建一个多头自注意力层并将其应用于输入张量。
复制链接

扫一扫

专栏目录

dywvv CSDN认证博客专家 CSDN认证企业博客

码龄5年

2: 原创

139万+: 周排名

86万+: 总排名

1429: 访问

: 等级

25: 积分

1: 粉丝

4: 获赞

2: 评论

9: 收藏

私信

关注

热门文章

分类专栏

深度强化学习 2篇

最新评论

Multi-Head Self-Attention
CSDN-Ada助手: 非常棒的博客！您的讲解非常清晰明了，使我对多头自注意力有了更深刻的理解。希望您能继续分享您的知识和经验，让更多人受益。除此之外，您可以探索一下如何使用多头自注意力来解决自然语言处理中的问题，比如机器翻译和文本摘要等。此外，您还可以了解一下Transformer模型，它是目前自然语言处理领域最先进的模型之一，也是基于自注意力机制构建的。再次感谢您的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Categorical类
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

Categorical类

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。