解析:普通的矩阵乘法时间复杂度为:O(n^3logk),会超时
该矩阵式循环矩阵,每一层都等于上一层右移一位。循环矩阵相乘等于循环矩阵,所以时间复杂度缩小为O(n^2logk)
其实还可以更简单的,开个一维数组,然后通过规律应用
#include<iostream>
#include<cstdio>
#include<string.h>
using namespace std;
#define N 505
typedef long long LL;
struct node
{
LL a[N][N];
};
LL n,m,d,f[N];
node sa;
node x,y;
node t1,t,e;
node multi()
{
LL i=0,j,r;
//for(i=0; i<n; i++)
for(j=0; j<n; j++)
{
t1.a[i][j]=0;
for(r=0; r<n; r++)
{
t1.a[i][j]=(t1.a[i][j]+x.a[i][r]*y.a[r][j])%m;
}
}
for(i=1;i<n;i++)
{
for(j=0;j<n;j++)
t1.a[i][j]=t1.a[i-1][(j-1+n)%n];
}
return t1;
}
void find1(LL k)
{
LL i,w=0,j;
t=e;
while(k)
{
if(k&1)
{
x = t;
y = sa;
t=multi();
}
x = y = sa;
sa=multi();
k>>=1;
}
LL res;
for(i=0; i<n; i++)
{
if(w>0) printf(" ");
w++;
res=0;
for(j=0; j<n; j++)
res=(res+f[j]*t.a[i][j])%m;
printf("%lld",res);
}
puts("");
}
int main()
{
LL i,j,k;
memset(e.a,0,sizeof(e.a));
for(i=0; i<N; i++) e.a[i][i]=1;
while(~scanf("%lld%lld%lld%lld",&n,&m,&d,&k))
{
for(i=0; i<n; i++) scanf("%lld",&f[i]);
memset(sa.a,0,sizeof(sa.a));
for(i=0; i<n; i++)
{
sa.a[i][i]=1;
for(j=1; j<=d; j++)
{
sa.a[i][(i+j)%n]=sa.a[i][(i-j+n)%n]=1;
}
}
find1(k);
}
return 0;
}