翻译一下题目:实际上就是要我们从nk件物品里面选出若干件,使得其数量模k等于r的方案数。f[i][j]表示前i件物品拿了若干件使得其数量模k等于j的方案数。显然有dp方程:f[i][j]=f[i-1][j]+f[i-1][j-1]。初始值:f[0][0]=1.用矩阵快速幂加速一下就好啦。时间复杂度为 O(lognk∗k3)
#include <cstdio>
#include <cstring>
#define N 51
#define ll long long
int n,mod,r;
ll kk;
inline int read(){
int x=0,f=1;char ch=getchar();
while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();}
while(ch>='0'&&ch<='9') x=x*10+ch-'0',ch=getchar();
return x*f;
}
struct Matrix{
int mat[N][N];
Matrix(bool t){
memset(mat,0,sizeof(mat));
if(t) for(int i=0;i<n;++i) mat[i][i]=1;
}
Matrix operator*(Matrix b){
Matrix res(0);
for(int i=0;i<n;++i)
for(int j=0;j<n;++j)
for(int k=0;k<n;++k)
res.mat[i][j]=(res.mat[i][j]+(ll)mat[i][k]*b.mat[k][j])%mod;
return res;
}
Matrix operator^(ll k){
Matrix base(0),res(1);
memcpy(base.mat,mat,sizeof(mat));
for(;k;k>>=1,base=base*base)
if(k&1) res=res*base;
return res;
}
}trans(0),ans(0);
int main(){
// freopen("a.in","r",stdin);
kk=read();mod=read();n=read();r=read();
kk*=n;
for(int i=0;i<n;++i) trans.mat[i][i]++,trans.mat[(i-1+n)%n][i]++;
ans.mat[0][0]=1;
ans=ans*(trans^kk);
printf("%d\n",ans.mat[0][r]);
return 0;
}