我们考虑n个台子上的牛最少的一个台子上有m只,记这个台子为i,则对于所有的 j≡i(modg) , g=gcd(N,m) ,台子j上的牛也必为m只。其余台子上的牛最多m+1只,且具有周期性,即以g为周期。具体证明请参见官方题解:传送门
因此对于最少的牛数为m(m< n)的情况,我们一共有
2gcd(N,m)−1
种方案。
m=n时,只有1种方案。
因此我们的答案就是
ANS=1−2N+∑Nm=12gcd(m,N)
考虑枚举gcd g,
ANS=1−2N+∑g∣N2gφ(Ng).
我们可以 O(n−√) 的枚举n的质因数,然后dfs枚举g。
利用以下公式计算欧拉函数:
φ(x=pe11pe22⋯peii)=x∗(p1−1)(p2−1)⋯(pi−1)p1p2⋯pi.
复杂度应该就是n的因子个数*logn级别,也就是 O(n−√∗logn)
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <queue>
#include <vector>
using namespace std;
#define ll long long
#define inf 0x3f3f3f3f
#define N 100010
#define mod 1000000007
inline ll read(){
ll x=0,f=1;char ch=getchar();
while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();}
while(ch>='0'&&ch<='9') x=x*10+ch-'0',ch=getchar();
return x*f;
}
ll n,ans=0;
vector<ll>p;
vector<int>e;
inline int ksm(int base,ll k){
int res=1;
for(;k;k>>=1,base=(ll)base*base%mod)
if(k&1) res=(ll)res*base%mod;return res;
}
void dfs(int cnt,ll g,ll mul1,ll mul2){//mul1--(pi-1)*(pj-1) mul2--(pi)*(pj)
if(cnt==p.size()){
if(g==1) return;
ans+=(ll)ksm(2,n/g)*(g/mul2%mod*mul1%mod)%mod;ans%=mod;return;
}dfs(cnt+1,g,mul1,mul2);mul1=mul1*(p[cnt]-1)%mod;mul2*=p[cnt];
for(int i=1;i<=e[cnt];++i)
g*=p[cnt],dfs(cnt+1,g,mul1,mul2);
}
int main(){
// freopen("gymnasts.in","r",stdin);
// freopen("gymnasts.out","w",stdout);
n=read();ll x=n;
for(int i=2;(ll)i*i<=n;++i){
if(x%i) continue;p.push_back(i);int tot=0;
while(x%i==0) x/=i,tot++;
e.push_back(tot);
}if(x>1) p.push_back(x),e.push_back(1);
dfs(0,1,1,1);
ans=(ans+1-(n-1))%mod;if(ans<0) ans+=mod;
printf("%lld\n",ans);
return 0;
}