CCF-CSP练习 矩阵运算
CCF 202305-2 矩阵运算
题目背景
Softmax(Q×KTd)×V 是 Transformer 中注意力模块的核心算式,其中 Q、K 和 V 均是 n 行 d 列的矩阵,KT 表示矩阵 K 的转置,× 表示矩阵乘法。
问题描述
为了方便计算,顿顿同学将 Softmax 简化为了点乘一个大小为 n 的一维向量 W:
(W⋅(Q×KT))×V
点乘即对应位相乘,记 W(i) 为向量 W 的第 i 个元素,即将 (Q×KT) 第 i 行中的每个元素都与 W(i) 相乘。
现给出矩阵 Q、K 和 V 和向量 W,试计算顿顿按简化的算式计算的结果。
输入格式
从标准输入读入数据。
输入的第一行包含空格分隔的两个正整数 n 和 d,表示矩阵的大小。
接下来依次输入矩阵 Q、K 和 V。每个矩阵输入 n 行,每行包含空格分隔的 d 个整数,其中第 i 行的第 j 个数对应矩阵的第 i 行、第 j 列。
最后一行输入 n 个整数,表示向量 W
输出格式
输出到标准输出中。
输出共 n 行,每行包含空格分隔的 d 个整数,表示计算的结果。
样例输入
3 2
1 2
3 4
5 6
10 10
-20 -20
30 30
6 5
4 3
2 1
4 0 -5
样例输出
480 240
0 0
-2200 -1100
子任务
70 的测试数据满足:n≤100 且 d≤10;输入矩阵、向量中的元素均为整数,且绝对值均不超过 30。
全部的测试数据满足:n≤104 且 d≤20;输入矩阵、向量中的元素均为整数,且绝对值均不超过 1000。
提示
请谨慎评估矩阵乘法运算后的数值范围,并使用适当数据类型存储矩阵中的整数。
我的提交
#include<bits/stdc++.h>
using namespace std;
int q[1001][21],kt[21][1001],v[1001][21],w[1001];
int qkt[1001][1001];
int ans[1001][21];
int main()
{
int n,d,i,j;
cin>>n>>d;
for(i=0;i<n;i++) //Q//1 2
for(j=0;j<d;j++) //3 4
cin>>q[i][j]; //5 6
for(j=0;j<n;j++)
for(i=0;i<d;i++) //KT//10 -20 30
cin>>kt[i][j]; //10 -20 30
for(i=0;i<n;i++) //V//6 5
for(j=0;j<d;j++) //4 3
cin>>v[i][j]; //2 1
for(i=0;i<n;i++)
cin>>w[i]; //W//4 0 -5
/*//检验KT
for(i=0;i<d;i++)
{
for(j=0;j<n;j++)
cout<<kt[i][j];
cout<<endl;
}
*/
//Q*KT
int k,t;
for(i=0;i<n;i++) //Q行
for(j=0;j<d;j++) //Q列 for(t=0;t<d;t++)//KT行
for(k=0;k<n;k++)//KT列
qkt[i][k]+=q[i][j]*kt[j][k];
//W·(Q*KT)
for(i=0;i<n;i++)
for(j=0;j<n;j++)
{
qkt[i][j]*=w[i];
//cout<<qkt[i][j];
}
/*//检验Q*KT
for(i=0;i<n;i++)
{
for(j=0;j<n;j++)
cout<<qkt[i][j]<<" ";
cout<<endl;
}
*/
//W·(Q*KT)*V
for(i=0;i<n;i++) //wqkt行
{
for(j=0;j<d;j++) //V列
{
for(k=0;k<n;k++)//wqkt列,V行
{
ans[i][j]+=qkt[i][k]*v[k][j];
}
//cout<<"(i"<<i<<",j"<<j<<")"<<" "<<qkt[i][k]<<"+"<<v[k][j]<<"=";
cout<<ans[i][j]<<" ";
}
cout<<endl;
}
}