一道模板题
可以发现相乘的三个for可以都for到n
矩阵可以把时间复杂度缩为
n3logk
#include<bits/stdc++.h>
using namespace std;
#define FOR(i,x,y) for(int i=(x);i<=(y);i++)
#define P 1000000007
struct Mat{
int A[105][105],n;
Mat(){n=0;memset(A,0,sizeof A);}
void Rd(int m){n=m;FOR(i,1,n)FOR(j,1,n)scanf("%d",&A[i][j]);}
Mat operator *(const Mat &B)const{
Mat res;
res.n=n;
FOR(i,1,n)FOR(k,1,n)
if(A[i][k])FOR(j,1,n){
res.A[i][j]=(res.A[i][j]+1ll*A[i][k]*B.A[k][j]%P)%P;
}
return res;
}
Mat operator ^(long long k)const{
Mat ans,res=*this;
FOR(i,1,n)ans.A[i][i]=1;
ans.n=n;
while(k){
if(k&1)ans=ans*res;
k>>=1;
res=res*res;
}
return ans;
}
void Print(){
FOR(i,1,n){
FOR(j,1,n)printf("%d ",A[i][j]);
puts("");
}
puts("");
}
}T;
int main(){
int n;
long long k;
scanf("%d%lld",&n,&k);
T.Rd(n);
T=T^k;
T.Print();
return 0;
}
矩阵可以优化dp
一般是将dp的转移简化为Si=A*Si-1
所以
Si=S0∗Ai
然后A^i这一部分就可用过矩阵快速幂解决
by ZeroKei