交叉注意力公式:
注意力的输入:
(1)K=V:图像的全局特征
(2)Q:告诉attention需要关注哪些重要特征
公式计算过程理解:
(1):Q和K相乘,对应Query和Key进行点积运算,得到的是Query和Key之间的相似性;
(2):再用Key向量的维度进行scaling,即将计算得到的相似度矩阵维度,缩放到与K=V相同尺度;
(3):对相似度权重矩阵进行归一化
(1)K=V:图像的全局特征
(2)Q:告诉attention需要关注哪些重要特征
(1):Q和K相乘,对应Query和Key进行点积运算,得到的是Query和Key之间的相似性;
(2):再用Key向量的维度进行scaling,即将计算得到的相似度矩阵维度,缩放到与K=V相同尺度;
(3):对相似度权重矩阵进行归一化