pytorch学习之注意力机制

最新推荐文章于 2024-06-04 15:18:43 发布

哆来咪发呀

最新推荐文章于 2024-06-04 15:18:43 发布

阅读量1.2k

点赞数 1

分类专栏： pytorch学习

本文链接：https://blog.csdn.net/Gpy_2014/article/details/104399799

版权

Attention 是一种通用的带权池化方法，输入由两部分构成：询问（query）和键值对（key-value pairs）。
在这里插入图片描述

不同的attetion layer的区别在于score函数的选择，两种常用的注意层 Dot-product Attention 和 Multilayer Perceptron Attention

点积注意力

在这里插入图片描述

class DotProductAttention(nn.Module): 
    def __init__(self, dropout, **kwargs):
        super(DotProductAttention, self).__init__(**kwargs)
        self.dropout = nn.Dropout(dropout)

    # query: (batch_size, #queries, d)
    # key: (batch_size, #kv_pairs, d)
    <

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

哆来咪发呀

关注关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
pytorch学习之注意力机制

Attention 是一种通用的带权池化方法，输入由两部分构成：询问（query）和键值对（key-value pairs）。不同的attetion layer的区别在于score函数的选择，两种常用的注意层 Dot-product Attention 和 Multilayer Perceptron Attention点积注意力class DotProductAttention(nn....
复制链接

扫一扫