Description
两个人玩儿n局石头剪刀布,每局每个人出石头剪刀布的概率相同,玩
n
局后假设第一个人赢
Input
第一行一整数
T
表示用例组数,每组用例输入两个整数
(1≤T≤20,1≤n≤105,108≤mod≤109,mod是素数)
Output
对于每组用例,输出 s×32n 模 mod 的结果
Sample Input
5
1 998244353
2 998244353
3 998244353
4 998244353
5 998244353
Sample Output
6
90
972
9720
89910
Solution
ans=∑a=0n∑b=0n−a3ngcd(a,b)CanCbn−a=3n∑d=1nd×F(d) ,其中 F(d)=∑a=0n∑b=0n−aCanCbn−a[gcd(a,b)=d]
令 f(d)=∑a=0n∑b=0n−aCanCbn−a[d|gcd(a,b)][gcd(a,b)>0]=∑a=0nd∑b=0nd−iCidnCjdn−id−1
由 F(d) 和 f(d) 的定义知 f(d)=∑d|nF(n) ,莫比乌斯反演得 F(k)=∑k|dμ(dk)f(d) ,进而
ans=∑k=1nkF(k)=∑k=1nk∑k|dμ(dk)f(d)=∑d=1n∑k|dkμ(dk)f(d)=∑d=1nφ(d)f(d)
∑i=0nd∑j=0nd−iCidnCjdn−id=∑i=0nd∑j=0nd−iCid+jdnCjdid+jd=∑i=0nd∑j=0iCidnCjdid(令i=i+j)=n!∑i=0nd1(n−id)!∑j=0i1(jd)!1((i−j)d)!
用 FFT 处理 ∑j=0i1(jd)!1((i−j)d)! ,时间复杂度 O(∑d=1nndlognd)=O(nlog2n)
Code
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
using namespace std;
typedef long long ll;
#define maxn 100005
#define maxfft 262144+5
const double pi=acos(-1.0);
int T,n,mod,fact[maxn],inv[maxn],A[maxn],B[maxfft];
int inc(int a,int b)
{
return a+b>=mod?a+b-mod:a+b;
}
int dec(int a,int b)
{
return a-b<0?a-b+mod:a-b;
}
struct cp
{
double a,b;
cp operator +(const cp &o)const {return (cp){a+o.a,b+o.b};}
cp operator -(const cp &o)const {return (cp){a-o.a,b-o.b};}
cp operator *(const cp &o)const {return (cp){a*o.a-b*o.b,b*o.a+a*o.b};}
cp operator *(const double &o)const {return (cp){a*o,b*o};}
cp operator !() const{return (cp){a,-b};}
}w[maxfft];
int pos[maxfft];
void fft_init(int len)
{
int j=0;
while((1<<j)<len)j++;
j--;
for(int i=0;i<len;i++)
pos[i]=pos[i>>1]>>1|((i&1)<<j);
}
void fft(cp *x,int len,int sta)
{
for(int i=0;i<len;i++)
if(i<pos[i])swap(x[i],x[pos[i]]);
w[0]=(cp){1,0};
for(unsigned i=2;i<=len;i<<=1)
{
cp g=(cp){cos(2*pi/i),sin(2*pi/i)*sta};
for(int j=i>>1;j>=0;j-=2)w[j]=w[j>>1];
for(int j=1;j<i>>1;j+=2)w[j]=w[j-1]*g;
for(int j=0;j<len;j+=i)
{
cp *a=x+j,*b=a+(i>>1);
for(int l=0;l<i>>1;l++)
{
cp o=b[l]*w[l];
b[l]=a[l]-o;
a[l]=a[l]+o;
}
}
}
if(sta==-1)for(int i=0;i<len;i++)x[i].a/=len,x[i].b/=len;
}
cp x[maxfft],y[maxfft],z[maxfft];
void FFT(int *a,int *b,int n,int m,int *c)
{
for(int i=0;i<n+m-1;i++)c[i]=0;
if(n<=100&&m<=100||min(n,m)<=5)
{
for(int i=0;i<n;i++)
for(int j=0;j<m;j++)
c[i+j]=inc(c[i+j],(ll)a[i]*b[j]%mod);
return ;
}
int len=1;
while(len<n+m)len<<=1;
fft_init(len);
for(int i=0;i<len;i++)
{
int aa=i<n?a[i]:0,bb=i<m?b[i]:0;
x[i]=(cp){(aa>>15),(aa&32767)},y[i]=(cp){(bb>>15),(bb&32767)};
}
fft(x,len,1),fft(y,len,1);
for(int i=0;i<len;i++)
{
int j=len-1&len-i;
z[i]=((x[i]+!x[j])*(y[i]-!y[j])+(x[i]-!x[j])*(y[i]+!y[j]))*(cp){0,-0.25};
}
fft(z,len,-1);
for(int i=0;i<n+m-1;i++)
{
ll ta=(ll)(z[i].a+0.5)%mod;
ta=(ta<<15)%mod;
c[i]=inc(c[i],ta);
}
for(int i=0;i<len;i++)
{
int j=len-1&len-i;
z[i]=(x[i]-!x[j])*(y[i]-!y[j])*(cp){-0.25,0}+(x[i]+!x[j])*(y[i]+!y[j])*(cp){0,0.25};
}
fft(z,len,-1);
for(int i=0;i<n+m-1;i++)
{
ll ta=(ll)(z[i].a+0.5)%mod,tb=(ll)(z[i].b+0.5)%mod;
ta=(ta+(tb<<30))%mod;
c[i]=inc(c[i],ta);
}
}
int euler[maxn],prime[maxn],res;
void get_euler(int n=100000)
{
memset(euler,0,sizeof(euler));
euler[1]=1;
res=0;
for(int i=2;i<=n;i++)
{
if(!euler[i])euler[i]=i-1,prime[res++]=i;
for(int j=0;j<res&&prime[j]*i<=n;j++)
{
if(i%prime[j]) euler[prime[j]*i]=euler[i]*(prime[j]-1);
else
{
euler[prime[j]*i]=euler[i]*prime[j];
break;
}
}
}
}
int mod_pow(int a,int b)
{
int ans=1;
while(b)
{
if(b&1)ans=(ll)ans*a%mod;
a=(ll)a*a%mod;
b>>=1;
}
return ans;
}
int main()
{
get_euler();
scanf("%d",&T);
while(T--)
{
scanf("%d%d",&n,&mod);
fact[0]=1;
for(int i=1;i<=n;i++)fact[i]=(ll)i*fact[i-1]%mod;
inv[1]=1;
for(int i=2;i<=n;i++)inv[i]=mod-(ll)(mod/i)*inv[mod%i]%mod;
inv[0]=1;
for(int i=1;i<=n;i++)inv[i]=(ll)inv[i]*inv[i-1]%mod;
int ans=0;
for(int d=1;d<=n;d++)
{
int temp=0;
for(int i=0;i<=n/d;i++)A[i]=inv[i*d];
FFT(A,A,n/d+1,n/d+1,B);
for(int i=0;i<=n/d;i++)
temp=inc(temp,(ll)inv[n-i*d]*B[i]%mod);
temp=(ll)temp*fact[n]%mod*euler[d]%mod;
ans=inc(ans,temp);
}
for(int i=1;i<=n;i++)ans=dec(ans,euler[i]);
ans=(ll)ans*mod_pow(3,n)%mod;
printf("%d\n",ans);
}
return 0;
}