自然语言处理（十七）：Transformer掩码张量

GeniusAng丶

已于 2022-01-22 11:49:20 修改

阅读量980

点赞数 2

分类专栏：自然语言处理文章标签：自然语言处理人工智能 nlp 深度学习 transformer

于 2022-01-15 15:25:47 首次发布

本文链接：https://blog.csdn.net/weixin_45707277/article/details/122510868

版权

自然语言处理专栏收录该内容

31 篇文章 40 订阅

订阅专栏

自然语言处理笔记总目录

Transformer介绍

生成掩码张量的代码分析：

def subsequent_mask(size):
    attn_shape = (1, size, size)
    subsequent_mask = np.triu(np.ones(attn_shape), k=1).astype('uint8')
    return torch.from_numpy(1 - subsequent_mask)

a = subsequent_mask(10)
print(a)
print(a.shape)

plt.figure()
plt.imshow(a[0])
plt.show()

tensor([[[1, 0, 0, 0, 0, 0, 0, 0, 0, 0],
         [1, 1, 0, 0, 0, 0, 0, 0, 0, 0],
         [1, 1, 1, 0, 0, 0, 0, 0, 0, 0],
         [1, 1, 1, 1, 0, 0, 0, 0, 0, 0],
         [1, 1, 1, 1, 1, 0, 0, 0, 0, 0],
         [1, 1, 1, 1, 1, 1, 0, 0, 0, 0],
         [1, 1, 1, 1, 1, 1, 1, 0, 0, 0],
         [1, 1, 1, 1, 1, 1, 1, 1, 0, 0],
         [1, 1, 1, 1, 1, 1, 1, 1, 1, 0],
         [1, 1, 1, 1, 1, 1, 1, 1, 1, 1]]], dtype=torch.uint8)
torch.Size([1, 10, 10])

在这里插入图片描述

解析：0代表遮掩还是1代表遮掩这里可以自定义，上图的横坐标可以看作输出，纵坐标看做输入，在第0个输出是看不到第0个输入的（其实是可以看到一个输入的起始符号的），第1个输出只能看到输入的第0个，依次类推。

np.triu演示：
主对角线为1、5、9进行演示，左下部分清零

a = np.triu([[1,2,3],
			 [4,5,6],
			 [7,8,9],
			 [10,11,12]], k=0)

print(a)

array([[ 1,  2,  3],
       [ 0,  5,  6],
       [ 0,  0,  9],
       [ 0,  0, 0]])

a = np.triu([[1,2,3],
			 [4,5,6],
			 [7,8,9],
			 [10,11,12]], k=-1)

print(a)

array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 0,  8,  9],
       [ 0,  0, 12]])

a = np.triu([[1,2,3],
			 [4,5,6],
			 [7,8,9],
			 [10,11,12]], k=1)

print(a)

array([[ 0,  2,  3],
       [ 0,  0,  6],
       [ 0,  0,  0],
       [ 0,  0, 0]])

GeniusAng丶

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
自然语言处理（十七）：Transformer掩码张量

自然语言处理（十七）：Transformer掩码张量
复制链接

扫一扫

专栏目录