,,赤果果的裸polya,,但是n略大,,
所以我们不能直接旋转从 0到n,我们需要优化一下,
我们可以枚举循环的个数k,那么0到n中有多少是循环个数是k的那,,就是phi(n/k)个。。我们可以先处理处n的素数因子,然后可以快速dfs出所有可行的k。。
注意,,P不是合数,,不能到最后才除以n(置换群的个数),可以在中间快速幂的时候幂次减一避免最后除P
#include<iostream>
#include<cstdio>
#include<math.h>
#include<algorithm>
#include<map>
#include<set>
#include<bitset>
#include<stack>
#include<queue>
#include<string.h>
#include<string>
#include<cstring>
#include<vector>
#include<time.h>
#include<stdlib.h>
using namespace std;
#define INF 0x3f3f3f3f
#define INFLL 0x3f3f3f3f3f3f3f3f
#define FIN freopen("input.txt","r",stdin)
#define mem(x,y) memset(x,y,sizeof(x))
typedef unsigned long long ULL;
typedef long long LL;
#define fuck(x) cout<<x<<endl;
#define lson l,m,rt<<1
#define rson m+1,r,rt<<1|1
typedef pair<pair<int,int>,int> PIII;
typedef pair<int,int> PII;
const double eps=1e-5;
const int MX=1e5+5;
int n,P;
int prime[MX];
bool isprime[MX];
void init()
{
prime[0]=0;
mem(isprime,1);
for(int i=2; i<MX; i++)
{
if(isprime[i])
{
prime[++prime[0]]=i;
}
for(int j=1; i*prime[j]<MX; j++)
{
isprime[i*prime[j]]=0;
if(i%prime[j]==0)break;
}
}
}
int quick_pow(int a,int x)
{
a%=P;
int ans=1;
while(x)
{
if(x&1)ans=(LL)a*ans%P;
a=(LL)a*a%P;
x>>=1;
}
return ans;
}
int ans;
int pi[MX][2],pc;
void dfs(int dep,int val,int phi)
{
if(dep==pc+1)
{
//cout<<dep<<" "<<val<<" "<<phi<<endl;
ans+=(LL)phi*quick_pow(n,n/val-1)%P;
return;
}
dfs(dep+1,val,phi);
for(int i=1; i<=pi[dep][1]; i++)
{
if(i==1)
{
val*=pi[dep][0];
phi*=(pi[dep][0]-1);
}
else val*=pi[dep][0], phi*=pi[dep][0];
dfs(dep+1,val,phi);
}
}
int cal()
{
int up=sqrt(n)+1;
int nn=n;
pc=0;
for(int i=1; prime[i]<=up&&nn!=1; i++)
if(nn%prime[i]==0)
{
pi[++pc][0]=prime[i];
pi[pc][1]=0;
while(nn%prime[i]==0)nn/=prime[i],pi[pc][1]++;
}
if(nn!=1)pi[++pc][0]=nn,pi[pc][1]=1;
ans=0;
dfs(1,1,1);
return ans%P;
}
int main()
{
init();
int T;
FIN;
cin>>T;
while(T--)
{
scanf("%d%d",&n,&P);
printf("%d\n",cal());
}
return 0;
}