Pytorch实现dot/mlp attention

最新推荐文章于 2024-02-09 17:28:27 发布

VIP文章睡熊猛醒

最新推荐文章于 2024-02-09 17:28:27 发布

阅读量3.2k

点赞数 2

分类专栏：深度学习文章标签： attention pytorch

本文链接：https://blog.csdn.net/weixin_41089007/article/details/102331185

版权

国庆节疯玩了7天，感觉整个人已经成为一条咸鱼了，在上班前一晚把attention机制复习了一下，就当是收收心了（感到羞愧）。

首先实现一些函数，称为attention_utils.py

import numpy as np
import torch
import torch.nn.functional as F


def create_src_lengths_mask(batch_size, src_lengths):
    '''
    生成布尔掩码以防止注意力超出source的末尾
    :param batch_size: int
    :param src_lengths: [batch_size] 每个句子的实际长度
    :return: [batch_size, max_src_len]
    '''
    max_src_len = src_lengths.max()
    # [1, max_src_len]
    src_indices = torch.arange(0, max_src_len).unsqueeze(0).type_as(src_lengths)
    # [batch_size, max_src_len]
    src_indices = src_indices.expand(batch_size, max_src_len)
    src_lengths = src_lengths.unsqueeze(1).expand(batch_size, max_src_len)
    # 小于实际长度的为1，大于的为0，detach截断反向梯度传播
    return (src_indices < src_lengths).int().detach()


def masked_softmax(scores, src_lengths, src_length_masking=True):
    '''
    先生成mask,然后再进行softmax。
    '''
    if src_length_masking:
        batch_size, max_src_len = scores.size()
        # compute masks
        src_mask = create_src_lengths_mask(batch_size, src_lengths)
        # Fill pad positions with -inf
        scores = scores.masked_fill(src_mask == 0, -np.inf)

    # 转换为float16，然后再次转换回来以防止loss爆炸
    return F.softmax(scores.float(), dim=-1).type_as(scores)

然后实现一个无attention的基础类，base_attention.py

import

最低0.47元/天解锁文章

睡熊猛醒

关注

2
点赞
踩
19

收藏

觉得还不错? 一键收藏
2
评论
Pytorch实现dot/mlp attention

国庆节疯玩了7天，感觉整个人已经成为一条咸鱼了，在上班前一晚把attention机制复习了一下，就当是收收心了（感到羞愧）。首先实现一些函数，称为attention_utils.pyimport numpy as npimport torchimport torch.nn.functional as Fdef create_src_lengths_mask(batch_size...
复制链接

扫一扫