min_25筛详解

最新推荐文章于 2024-07-14 21:17:23 发布

Lstdo

最新推荐文章于 2024-07-14 21:17:23 发布

阅读量664

点赞数

本文链接：https://blog.csdn.net/luositing/article/details/104005161

版权

扯淡

min_25筛是由min_25提出的求积性函数前缀和的亚线性算法，和一个叫“扩展埃氏筛”的东西有着微妙的关系。

至于是什么关系，我也不太清楚，反正有人说很像有人说就是一个东西（雾）

这段话并不是废话

约定

为了方便后面描述，这里写一些用到的约定和符号表示，以免产生恐惧

$1$ 被开除正整数籍也就是说“前缀和”之类的都是从 $2$ 开始，对答案所求的前缀和同样，最后手动加 $1$

$\pi(n)$ 表示 $\sim n$ 中质数个数的规模（其实问题不大，后面就懂了）

$p_i$ 表示第 $i$ 个质数，单独的 $p$ 均表示质数

$p r i m e$ 表示质数集合 $m i n p (i)$ 表示 $i$ 的最小质因子

$p^c$ 表示一个只含一个质因子的数

流程

首先所求的函数 $f (n)$ 需要满足：

是个积性函数
在质数处的取值 $f (p)$ 是一个关于 $p$ 的多项式。我们把这个多项式拆成若干单项式分别计算在相加，这样就变成了" $f (p)$ 的值是一个关于 $p$ 的单项式"，我们记为 $f(p)=p^k$
$f(p^c)$ 的值可以快速计算

首先考虑计算这个东西

$\sum_{i=2}^n[i\in prime]i^k$

注意是 $i^k$ 不是 $f (i)$ ，虽然这里还没有区别，但它们只是质数位置相等

首先~~既然叫扩展埃氏筛~~先回忆一下埃氏筛在干什么：开始写下所有正整数，然后从小到大，如果一个没被筛说明它是质数，用它筛掉后面的倍数

我们可以用这个思路计算上面的式子，先算出所有的和，再用质数筛掉所有合数项

设 $g (n, j)$ 表示用前 $j$ 个质数筛了之后剩余项的和

$g(n,j)=\sum_{i=2}^n[i \in prime \quad or\quad minp(i)>p_j]i^k$

和就是 $g(n,\pi(\sqrt{n}))$

注意合数的最小质因子不会超过 $\sqrt n$ ,所以如果 $p_j^2>n$ 有 $g (n, j) = g (n, j - 1)$

对剩下情况考虑转移，即从 $g (n, j - 1)$ 去掉被 $p_j$ 删掉的项

$g(n,j-1)=\sum_{i=2}^n[i\in prime \quad or \quad minp(i)\geq p_j]$

如果脑子转不过来，可以强行算

$[i\in prime \quad or \quad minp(i)\geq p_j]$ 且不满足 $\in prime \quad or\quad minp(i)>p_j]$
即
$[i\in prime \quad or \quad minp(i)\geq p_j]$ 且 $\notin prime] 且 [minp(i)\leq p_j]$
综上
$\notin prime,minp(i)=p_j]$

所以

$g(n,j)=g(n,j-1)-\sum_{i=2}^n[i \notin prime,minp(i)=p_j]i^k$

可以提一个 $p_j$ 出来,因为不能有质数，就把 $p_j$ 去掉，刚好是 $1$

$g(n,j)=g(n,j-1)-p_j^k\sum_{i=2}^{\lfloor\frac{n}{p_j}\rfloor}[minp(i)\geq p_j]i^k$

再次观察

$g(n,j)=\sum_{i=2}^n[i \in prime \quad or\quad minp(i)>p_j]i^k$

发现可以拆成小于 $p_j$ 的质数和大于等于 $p_j$ 的所有数，第二个就是刚才的式子

$g(n,j)=g(n,j-1)-p_j^k(g(\lfloor\frac{n}{p_j}\rfloor,j-1)-\sum_{i=1}^{j-1}p_i^k)$

注意 $n$ 由于都是一直整除，所以只会有 $O(\sqrt n)$ 种取值，可以整除分块找出来强行离散化。在记录某个值 $v$ 所在位置的时候，如果 $v>\sqrt n$ ,我们另开一个数组存到 $\lfloor\frac{n}{v}\rfloor$ 里面

然后后面只会用到最后一项，所以第二维可以滚掉

求答案时，设

$S(n,j)=\sum_{i=2}^n[minp(i)>p_j]f(i)$

分质数和合数分别计算

质数部分用 $g$ 算出来的减去前 $j$ 个

$g(n,\pi(\sqrt n))-\sum_{i=1}^jp^k_i$

合数部分枚举最小质因子和它的次数

$\sum_{k=j+1}^{p_k\leq\sqrt n}\sum_{e=1}^{p_k^e\leq n}f(p_k^e)(S(\lfloor\frac{n}{p_k^e}\rfloor,k)+[e>1])$

$[e > 1]$ 指如果指数大于 $1$ 它本身就是合数，需要统计答案

两部分相加即可

总复杂度大概 $O(n^{2\over3})$ 常数较小，大约 $2 s$ 过 $1 e 10$ , $3 s$ 过 $1 e 11$

模板题

#include <iostream>
#include <cstdio>
#include <cstring>
#include <cctype>
#include <cmath>

#define MAXN 200005
using namespace std;
typedef long long ll;
const int MOD=1e9+7,INV6=(MOD+1)/6;
inline int add(const int& x,const int& y){return x+y>=MOD? x+y-MOD:x+y;}
inline int dec(const int& x,const int& y){return x<y? x-y+MOD:x-y;}
int np[MAXN],pl[MAXN],cnt;
inline void init(const int& N)
{
	np[1]=1;
	for (int i=2;i<=N;i++)
	{
		if (!np[i]) pl[++cnt]=i;
		int x;
		for (int j=1;(x=i*pl[j])<=N;j++)
		{
			np[x]=1;
			if (i%pl[j]==0) break;
		}
	}
}
ll val[MAXN];
int tot;
int g1[MAXN],g2[MAXN],sum1[MAXN],sum2[MAXN];
int key[MAXN],yek[MAXN];
ll n;
int m;
inline int getkey(const ll& v){return v<=m? key[v]:yek[n/v];}
int S(ll n,int j)
{
	if (pl[j]>=n) return 0;
	int k=getkey(n);
	int ans=dec(dec(g2[k],g1[k]),dec(sum2[j],sum1[j]));
	for (int k=j+1;k<=cnt&&(ll)pl[k]*pl[k]<=n;k++)
		for (ll e=1,pe=pl[k];pe<=n;e++,pe*=pl[k])
			ans=add(ans,pe%MOD*(pe%MOD-1)%MOD*(S(n/pe,k)+(e>1))%MOD);				
	return ans;
}
int main()
{
	scanf("%lld",&n);
	m=sqrt(n);
	init(m);
	for (ll l=1,r;l<=n;l=r+1)
	{
		r=n/(n/l);
		val[++tot]=n/l;
		int t=val[tot]%MOD;
		g1[tot]=((ll)t*(t+1)/2)%MOD-1;
		g2[tot]=(ll)t*(t+1)%MOD*(2*t+1)%MOD*INV6%MOD-1;
		if (val[tot]<=m) key[val[tot]]=tot;
		else yek[n/(n/l)]=tot;
	}
	for (int j=1;j<=cnt;j++)
	{
		for (int i=1;i<=tot&&(ll)pl[j]*pl[j]<=val[i];i++)
		{
			int k=getkey(val[i]/pl[j]);
			g1[i]=dec(g1[i],(ll)pl[j]*dec(g1[k],sum1[j-1])%MOD);
			g2[i]=dec(g2[i],(ll)pl[j]*pl[j]%MOD*dec(g2[k],sum2[j-1])%MOD);
		}		
		sum1[j]=add(sum1[j-1],pl[j]),sum2[j]=add(sum2[j-1],(ll)pl[j]*pl[j]%MOD);
	}
	printf("%d\n",S(n,0)+1);
	return 0;
}