（杜教筛）P4213 【模板】杜教筛（Sum）

最新推荐文章于 2022-11-11 12:42:19 发布

guapi2333

最新推荐文章于 2022-11-11 12:42:19 发布

阅读量122

点赞数

分类专栏：数论

本文链接：https://blog.csdn.net/guapi2333/article/details/117969122

版权

数论专栏收录该内容

25 篇文章 2 订阅

订阅专栏

Label

杜教筛模板题

Description

$T(T\le 10)$ 组数据，每组数据包含一个正整数 $n(n<2^{31})$ ，求 $\sum_{i=1}^{n}\varphi(i)$ 与 $\sum_{i=1}^{n}\mu(i)$ 。

Solution

杜教筛

杜教筛一般用于处理数论函数前缀和的问题。杜教筛的基本思想是：对于求解某个数论函数 $f (n)$ 前缀和（而非一个线性表） $S(n)=\sum_{i=1}^{n}f(i)$ ，我们设法构造一个 $S (n)$ 关于 $S(\lfloor\frac{n}{i}\rfloor)$ 的递推式。

引理：对于任意两个数论函数 $f, g$ ，设 $S(n)=\sum_{i=1}^{n}f(i)$ ，则必有：

$\sum_{i=1}^{n}(f*g)(i)=\sum_{i=1}^{n}g(i)S(\lfloor\frac{n}{i}\rfloor)$

证明：按照P3327题解注释（2）（3）的方法，我们不难得到：

$\sum_{i=1}^{n}(f*g)(i)$

$=\sum_{i=1}^{n}\sum_{d|i}g(d)f(\frac{i}{d})$

$=\sum_{d=1}^{n}g(d)\sum_{i=1}^{n}[d|i]f(\frac{i}{d})$

$=\sum_{d=1}^{n}g(d)\sum_{i=1}^{n}[1|\frac{i}{d}]f(\frac{i}{d})$

$=\sum_{d=1}^{n}g(d)\sum_{i=1}^{\lfloor\frac{n}{d}\rfloor}f(i)$

$=\sum_{i=1}^{n}g(i)S(\lfloor\frac{n}{i}\rfloor),\square$

将引理 $\sum_{i=1}^{n}\sum_{d|i}(f*g)(i)=\sum_{i=1}^{n}g(i)S(\lfloor\frac{n}{i}\rfloor)$ 变形可得：

$g(1)S(n)+\sum_{i=2}^{n}g(i)S(\lfloor\frac{n}{i}\rfloor)=\sum_{i=1}^{n}(f*g)(i)$

$g(1)S(n)=\sum_{i=1}^{n}(f*g)(i)-\sum_{i=2}^{n}g(i)S(\lfloor\frac{n}{i}\rfloor)$ $(1)$

根据式(1)，我们可以构造如下求 $S (n)$ 的方法：

考虑之前学过的常见积性函数间卷积运算转换的公式，我们构造合适的数论函数 $g$ 进行构造，函数 $g$ 显然需满足 $f * g$ 为一个可以快捷求出前缀和（这样一来，如果我们可以快速求出 $\sum_{i=1}^{n}(f*g)(i)$ ）的函数且对于 $\forall xg(x)$ 易求。一般情况下，我们构造 $g (n) = 1$ 。

这样一来，剩下的问题在于 $\sum_{i=2}^{n}g(i)S(\lfloor\frac{n}{i}\rfloor)$ 怎么求：显然，我们可利用数论分块求此式的值。至于求和涉及到的每一项里 $S(\lfloor\frac{n}{i}\rfloor)$ ，我们可以再利用递推式 $(1)$ 求出它的值。

假设实际应用中涉及到的数论函数的值的线性表均线性复杂度可求，一般根据此方法直接递归计算的时间复杂度为 $O(n^{\frac{3}{4}})$ 。考虑先线性筛预处理得到 $S$ 的前 $n^{\frac{2}{3}}$ 项，剩余部分时间复杂度为 $O(\int_{o}^{n^{\frac{1}{3}}}\sqrt\frac{n}{x}dx)=O(n^{\frac{2}{3}})$ ，故整体算法时间复杂度为 $O(n^{\frac{2}{3}})$ 。

对于较大的 $S$ 的值，由于不同值的 $S(\lfloor\frac{n}{i}\rfloor)$ 个数不会超过 $2\sqrt n$ 个，故用map存下其对应的值较为简便。

求 $\sum_{i=1}^{n}\mu(i)$

考虑公式 $\mu*1=\epsilon$ 。

令 $f=\mu,g=1$ ，则：

$g(1)S(n)=\sum_{i=1}^{n}(f*g)(i)-\sum_{i=2}^{n}g(i)S(\lfloor\frac{n}{i}\rfloor)$

$\leftrightarrow S(n)=\sum_{i=1}^{n}\epsilon(i)-\sum_{i=2}^{n}S(\lfloor\frac{n}{i}\rfloor)=1-\sum_{i=2}^{n}S(\lfloor\frac{n}{i}\rfloor)$

算法时间复杂度为 $O(n^{\frac{2}{3}})$ 。

求 $\sum_{i=1}^{n}\varphi(i)$

考虑公式 $\varphi*1=id$

令 $f=\varphi,g=1$ ，则：

$g(1)S(n)=\sum_{i=1}^{n}(f*g)(i)-\sum_{i=2}^{n}g(i)S(\lfloor\frac{n}{i}\rfloor)$

$\leftrightarrow S(n)=\sum_{i=1}^{n}id(i)-\sum_{i=2}^{n}S(\lfloor\frac{n}{i}\rfloor)=\sum_{i=1}^{n}i-\sum_{i=2}^{n}S(\lfloor\frac{n}{i}\rfloor)=\frac{n(n+1)}{2}-\sum_{i=2}^{n}S(\lfloor\frac{n}{i}\rfloor)$

算法时间复杂度为 $O(n^{\frac{2}{3}})$ 。

根据以上两个过程，不难看出选择合适的 $g$ 与 $f * g$ 的重要性。

Code

#include<cstdio>
#include<iostream>
#include<map>
#define ri register int
#define ll long long
using namespace std;

const int MAXN=1e6;
int T,cnt,prime[MAXN];
ll N,smu[MAXN+20],sphi[MAXN+20];
bool notprime[MAXN+20];
map<ll,ll>Smu;
map<ll,ll>Sphi;

void EulaSieve()
{
	smu[1]=1,sphi[1]=1,notprime[1]=true;
	for(ri i=2;i<=MAXN;++i)
	{
		if(!notprime[i]) prime[++cnt]=i,smu[i]=-1,sphi[i]=i-1;
		for(ri j=1;j<=cnt&&i*prime[j]<=MAXN;++j)
		{
			notprime[i*prime[j]]=true;
			if(i%prime[j]==0)	sphi[i*prime[j]]=sphi[i]*prime[j];
			else	sphi[i*prime[j]]=sphi[i]*sphi[prime[j]];
			if(i%prime[j]==0) break;
			else smu[i*prime[j]]=-smu[i];
		}
	}
	for(ri i=1;i<=MAXN;++i) 
		smu[i]=smu[i-1]+smu[i],sphi[i]=sphi[i-1]+sphi[i];
}

ll S_mu(ll n)
{
	if(n<=MAXN) return smu[n];
	if(Smu[n]) return Smu[n];
	ll ans=1LL;
	for(ll l=2,r;l<=n;l=r+1)
	{
		r=n/(n/l);
		ans-=(r-l+1)*S_mu(n/l);
	}	
	return Smu[n]=ans;
}

ll S_phi(ll n)
{
	if(n<=MAXN) return sphi[n];
	if(Sphi[n]) return Sphi[n];
	ll ans=n*(n+1)/2LL;
	for(ll l=2,r;l<=n;l=r+1)
	{
		r=n/(n/l);
		ans-=(r-l+1)*S_phi(n/l);	
	}
	return Sphi[n]=ans;
}

int main()
{
	std::ios::sync_with_stdio(false);
	cin>>T;
	EulaSieve();
	for(ri op=1;op<=T;++op)
	{
		cin>>N;
		cout<<S_phi(N)<<" "<<S_mu(N)<<'\n';
	}
	return 0;
}