时间限制: 5.0s
内存限制: 512.0MB
【题目背景】
Softmax(Q×KTd)×V 是 Transformer 中注意力模块的核心算式,其中 Q、K 和 V 均是 n 行 d 列的矩阵,KT 表示矩阵 K 的转置,× 表示矩阵乘法。【问题描述】
为了方便计算,顿顿同学将 Softmax 简化为了点乘一个大小为 n 的一维向量 W:
(W⋅(Q×KT))×V
点乘即对应位相乘,记 W(i) 为向量 W 的第 i 个元素,即将 (Q×KT) 第 i 行中的每个元素都与 W(i) 相乘。现给出矩阵 Q、K 和 V 和向量 W,试计算顿顿按简化的算式计算的结果。
【输入格式】
从标准输入读入数据。输入的第一行包含空格分隔的两个正整数 n 和 d,表示矩阵的大小。
接下来依次输入矩阵 Q、K 和 V。每个矩阵输入 n 行,每行包含空格分隔的 d 个整数,其中第 i 行的第 j 个数对应矩阵的第 i 行、第 j 列。
最后一行输入 n 个整数,表示向量 W。
【输出格式】
输出到标准输出中。输出共 n 行,每行包含空格分隔的 d 个整数,表示计算的结果。
样例输入
3 2
1 2
3 4
5 6
10 10
-20 -20
30 30
6 5
4 3
2 1
4 0 -5样例输出
480 240
0 0
-2200 -1100子任务
70 的测试数据满足:n≤100 且 d≤10;输入矩阵、向量中的元素均为整数,且绝对值均不超过 30。全部的测试数据满足:n≤104 且 d≤20;输入矩阵、向量中的元素均为整数,且绝对值均不超过 1000。
提示
请谨慎评估矩阵乘法运算后的数值范围,并使用适当数据类型存储矩阵中的整数。
【思路详解】
1,将步骤一步步剥开
2,利用矩阵形式
【代码详解】
#include<iostream>
using namespace std;
//考察矩阵运算,综合了线性代数知识
int n,d;
int Q[101][11],KT[11][101],V[101][11];//此处,转置这个行为可以在一开始输入的时候就完成
int W[101];
long long temp[101][101],temp2[101][11];//临时变量保存
int main()
{
cin>>n>>d;
for(int i=1;i<=n;i++)
for(int j=1;j<=d;j++)
cin>>Q[i][j];
for(int i=1;i<=n;i++)
for(int j=1;j<=d;j++)
cin>>KT[j][i]; //矩阵转置可以在一开始就完成,将列输入成行的形式
for(int i=1;i<=n;i++)
for(int j=1;j<=d;j++)
cin>>V[i][j];
for(int i=1;i<=n;i++)
cin>>W[i];
//完成输入
for(int i=1;i<=n;i++)
for(int j=1;j<=n;j++)
{
for(int k=1;k<=d;k++)
temp[i][j]+=Q[i][k]*KT[k][j];//矩阵乘法的形式,由计算可知为n*n
}
for(int i=1;i<=n;i++)
for(int j=1;j<=n;j++)
{
temp[i][j]=temp[i][j]*W[i];//W[i]因为每个都要乘他的数
}
for(int i=1;i<=n;i++)
for(int j=1;j<=d;j++)
{
for(int k=1;k<=n;k++)
temp2[i][j]+=temp[i][k]*V[k][j];//矩阵乘法的形式,由计算可知为n*d
}
for(int i=1;i<=n;i++)
{
for(int j=1;j<=d;j++)
cout<<temp2[i][j]<<" ";
cout<<endl;
}
}