transformer之Attention机制及代码实现

Self-Attention:一种Attention机制,用于处理单个输入序列中的依赖关系。
Cross-Attention:一种Attention机制,用于处理两个或多个输入序列之间的依赖关系。
Gated Self-Attention:一种改进的Self-Attention机制,引入了门控机制来控制Attention输出。
Generalized Query Attention:一种扩展的Self-Attention机制,支持多个Query和多个Key-Value对。
这些Attention机制都可以用于自然语言处理、计算机视觉等领域,用于捕获输入数据中的依赖关系和语义信息。

以下是Attention机制的异同点表格,输出为Markdown格式:

Attention机制 Self-Attention Cross-Attention Gated Self-Attention Generalized Query Attention
输入 单个输入序列 两个或多个输入序列 单个输入序列 多个Query和多个Key-Value对
输出 Attention输出 Attention输出 Attention输出 Attention输出
依赖关系 单个输入序列中的依赖关系 两个或多个输入序列之间的依赖关系 单个输入序列中的依赖关系 多个Query和多个Key-Value对之间的依赖关系
门控机制
支持多个Query
支持多个Key-Value对

异同点总结

  • Self-Attention和Gated Self-Attention都用于处理单个输入序列中的依赖关系,但Gated Self-Attention引入了门控机制来控制Attention输出。
  • Cross-Attention用于处理两个或多个输入序列之间的依赖关系。
  • Generalized Query Attention支持多个Query和多个Key-Value对,用于处理更复杂的依赖关系。

代码实现

Self-Attention

import torch
import torch.nn as nn
import torch.nn.functional as F

class SelfAttention(nn.Module):
    def __init__(self, hidden_size, attention_heads):
        super(SelfAttention, self).__init__()
        self.hidden_size = hidden_size
        self.attention_heads = attention_heads
        self.query_linear = nn.Linear(hidden_size, hidden_size)
        self.key_linear = nn.Linear(hidden_size, hidden_size)
        self.value_linear = nn.Linear(hidden_size, hidden_size)
        self.dropout = nn.Dropout(0.1)

    def forward(self, x):
        # x: [batch_size, sequence_length, hidden_size]
        batch_size, sequence_length, _ = x.size()

        # Linear transformations
        query = self.query_linear(x)
        key = self.key_linear(x)
        value = self.value_linear(x)

        # Attention weights
        attention_weights = torch.matmul(query, key.transpose(-1, -2)) / math.sqrt(self.hidden_size)
        attention_weights = F.softmax(attention_weights, dim=-1)

        # Attention output
        attention_output 
  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
大学生就业服务平台管理系统按照操作主体分为管理员和用户。管理员的功能包括学生档案管理、字典管理、试卷管理、试卷选题管理、试题表管理、考试记录表管理、答题详情表管理、错题表管理、法律法规管理、法律法规收藏管理、法律法规留言管理、就业分析管理、论坛管理、企业管理、简历管理、老师管理、简历投递管理、新闻资讯管理、新闻资讯收藏管理、新闻资讯留言管理、学生信息管理、宣传管理、学生管理、职位招聘管理、职位收藏管理、招聘咨询管理、管理员管理。用户的功能等。该系统采用了Mysql数据库,Java语言,Spring Boot框架等技术进行编程实现。 大学生就业服务平台管理系统可以提高大学生就业服务平台信息管理问题的解决效率,优化大学生就业服务平台信息处理流程,保证大学生就业服务平台信息数据的安全,它是一个非常可靠,非常安全的应用程序。 管理员权限操作的功能包括管理新闻信息,管理大学生就业服务平台信息,包括考试管理,培训管理,投递管理,薪资管理等,可以管理新闻信息。 考试管理界面,管理员在考试管理界面中可以对界面中显示,可以对考试信息的考试状态进行查看,可以添加新的考试信息等。投递管理界面,管理员在投递管理界面中查看投递种类信息,投递描述信息,新增投递信息等。新闻信息管理界面,管理员在新闻信息管理界面中新增新闻信息,可以删除新闻信息。新闻信息类型管理界面,管理员在新闻信息类型管理界面查看新闻信息的工作状态,可以对新闻信息的数据进行导出,可以添加新新闻信息的信息,可以编辑新闻信息信息,删除新闻信息信息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值