先dp求解,在score>(base-1)^2后,状态转移就固定了,可以转化为矩阵,用矩阵快速幂来做
附上我参考的题解:https://blog.csdn.net/rain722/article/details/53070839
快速幂还需要加优化,不然超时,整数需要开unsigned long long,否则会溢出
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
using namespace std;
typedef unsigned long long ll;
int N;
const ll MOD=(1ull<<32);
ll d[40][10];
void init(int b)
{
int m=(b-1)*(b-1);
memset(d,0,sizeof(d));
for(int i=1;i<b;i++) d[0][i]=1;
for(int i=1;i<=m;i++)
for(int j=0;j<b;j++)
for(int k=0;k<b;k++)
{
if(k==j) continue;
int t=(k-j)*(k-j);
if(i-t<0) continue;
d[i][j]=(d[i][j]+d[i-t][k])%MOD;
}
}
struct node
{
ll a[160][160];
};
node shu,ans,mp;
//shu是输入的矩阵,ans是所求答案
node matrix(node x,node y)
{
memset(mp.a,0,sizeof(mp.a));
for(int i=1;i<=N;i++)
for(int p=1;p<=N;p++)
{
if(!x.a[i][p]) continue;
for(int j=1;j<=N;j++){
mp.a[i][j]=(mp.a[i][j]+x.a[i][p]*y.a[p][j]%MOD)%MOD;
//矩阵乘法
}
}
return mp;
}
void work(ll k)
{//矩阵快速幂
for(int i=1;i<=N;i++)
for(int j=1;j<=N;j++)
ans.a[i][j]=0;
for(int i=1;i<=N;i++) ans.a[i][i]=1;
node t=shu;
while(k){
if(k&1)
ans=matrix(ans,t);
k>>=1;
t=matrix(t,t);
}
}
void build(int b)
{
N=(b-1)*(b-1)*b;
int m=(b-1)*(b-1);
memset(shu.a,0,sizeof(shu.a));
for(int i=1;i<=N-b;i++) shu.a[i][i+b]=1;
for(int i=0;i<b;i++)
for(int j=0;j<b;j++)
if(i!=j)
{
shu.a[N-b+i+1][(m-(i-j)*(i-j))*b+j+1]=1;
}
}
ll solve(int b,int s)
{
ll ret=0;
int m=(b-1)*(b-1);
init(b);
if(s<m)
{
for(int i=0;i<b;i++)
ret=(ret+d[s][i])%MOD;
return ret;
}
build(b);
work(s-m+1);
for(int i=N-b+1;i<=N;i++)
for(int j=1;j<=N;j++)
{
int u=(j-1)/b;
int v=(j-1)%b;
ret=(ret+d[u][v]*ans.a[i][j]%MOD)%MOD;
}
return ret;
}
int main()
{
int T,kase=0;
int b,s;
scanf("%d",&T);
while(T--)
{
scanf("%d%d",&b,&s);
printf("Case %d: %llu\n",++kase,solve(b,s));
}
return 0;
}