时间限制: 5.0 秒
空间限制: 512 MiB
题目背景
Softmax(𝑄×𝐾𝑇𝑑)×𝑉Softmax(dQ×KT)×V 是 Transformer 中注意力模块的核心算式,其中 𝑄Q、𝐾K 和 𝑉V 均是 𝑛n 行 𝑑d 列的矩阵,𝐾𝑇KT 表示矩阵 𝐾K 的转置,×× 表示矩阵乘法。
题目描述
为了方便计算,顿顿同学将 SoftmaxSoftmax 简化为了点乘一个大小为 𝑛n 的一维向量 𝑊W:(𝑊⋅(𝑄×𝐾𝑇))×𝑉(W⋅(Q×KT))×V点乘即对应位相乘,记 𝑊(𝑖)W(i) 为向量 𝑊W 的第 𝑖i 个元素,即将 (𝑄×𝐾𝑇)(Q×KT) 第 𝑖i 行中的每个元素都与 𝑊(𝑖)W(i) 相乘。
现给出矩阵 𝑄Q、𝐾K 和 𝑉V 和向量 𝑊W,试计算顿顿按简化的算式计算的结果。
输入格式
从标准输入读入数据。
输入的第一行包含空格分隔的两个正整数 𝑛n 和 𝑑d,表示矩阵的大小。
接下来依次输入矩阵 𝑄Q、𝐾K 和 𝑉V。每个矩阵输入 𝑛n 行,每行包含空格分隔的 𝑑d 个整数,其中第 𝑖i 行的第 𝑗j 个数对应矩阵的第 𝑖i 行、第 𝑗j 列。
最后一行输入 𝑛n 个整数,表示向量 𝑊W。
输出格式
输出到标准输出。
输出共 𝑛n 行,每行包含空格分隔的 𝑑d 个整数,表示计算的结果。
样例输入
3 2
1 2
3 4
5 6
10 10
-20 -20
30 30
6 5
4 3
2 1
4 0 -5
样例输出
480 240
0 0
-2200 -1100
子任务
70%70% 的测试数据满足:𝑛≤100n≤100 且 𝑑≤10d≤10;输入矩阵、向量中的元素均为整数,且绝对值均不超过 3030。
全部的测试数据满足:𝑛≤104n≤104 且 𝑑≤20d≤20;输入矩阵、向量中的元素均为整数,且绝对值均不超过 10001000。
提示
请谨慎评估矩阵乘法运算后的数值范围,并使用适当数据类型存储矩阵中的整数。
解决方案:
#include<iostream>
#include<algorithm>
using namespace std;
int main(){
int n ,d;
cin>>n>>d;
int Q[n][d],K[n][d],V[n][d];
int KT[d][n],W[n];
int QKT[n][n];
int Ans[n][d];
for(int i =0;i<n;i++){
for(int j=0;j<d;j++){
cin >> Q[i][j];
}
}
for(int i =0;i<n;i++){
for(int j=0;j<d;j++){
cin >> K[i][j];
KT[j][i]= K[i][j];
}
}
for(int i =0;i<n;i++){
for(int j=0;j<d;j++){
cin >> V[i][j];
}
}
for(int i=0;i<n;i++){
cin >> W[i];
}
for(int i =0;i<n;i++){
for(int j=0;j<n;j++){
QKT[i][j]=0;
for(int x=0;x<d;x++){
QKT[i][j]=QKT[i][j]+Q[i][x]*KT[x][j];
}
}
}
for(int i =0;i<n;i++){
for(int j=0;j<d;j++){
Ans[i][j]=0;
for(int x=0;x<n;x++){
Ans[i][j]+=QKT[i][x]*V[x][j];
}
Ans[i][j]*=W[i];
}
}
for(int i =0;i<n;i++){
for(int j=0;j<d;j++){
cout<<Ans[i][j]<<" ";
}
cout<<endl;
}
return 0;
}