求[1,n]中所有素数之和_求出1~n之间的所以素数之和-CSDN博客

本文链接：https://blog.csdn.net/kongse_qi/article/details/107450308

问题描述

给定整数 $n$ ，求 $[1, n]$ 中所有素数的和，答案对998244353取模。

数据范围

1s，512M

对于 $100\%$ 的数据， $n\leq 10^{10}$

解题思路

回忆素数的欧拉筛法（Euler’s_sieve）。

对于当前数 $x$ ，若未被判定为合数，即为素数，将其插入素数列表末尾。
将 $x$ 与素数列表中的所有数从小到大相乘，并将乘积判定为合数。若 $x$ 为当前素数的倍数，则不再与下一个素数相乘。

因此当一个数被判定为合数时，必然是通过其最小素因数筛出。

证明如下：

设 $y=p_1^{a_1}\times p_2^{a_2}\times\cdots\times p_n^{a_n}$ ，其中 $p_1 < p_2 < \cdots < p_n$ ， $p_i$ 为素数。

若 $y$ 通过 $p_i$ 筛出，则 $y=p_i \times (p_1^{a_1}\times p_2^{a_2}\times\cdots\times p_i^{a_i-1}\cdots \times p_n^{a_n})$ ，而 $p_1^{a_1}\times p_2^{a_2}\times\cdots\times p_i^{a_i-1}\cdots \times p_n^{a_n}$ 为 $p_1$ 的倍数，因而在 $p_1$ 筛完后操作终止，不可能继续到 $p_i$ 。

定义 $S (x, y)$ ，表示在 $[2, x]$ 中，通过所有不大于 $y$ 的质数筛完后依然未被判定为合数的数之和。

定于 $T (x, y)$ ，表示满足 $S (x, y)$ 要求的所有数的集合。

根据上文分析，得到关于 $T (x, y)$ 的性质：属于 $T (x, y)$ 的数要么是素数，要么其最小素因子大于 $y$ 。

那么问题所求的值为 $\lfloor\sqrt{n}\rfloor) \bmod 998244353$ 。

可以通过状态转移方程求解。

初始值 $S(x,1)=\sum\limits_{i=2}^{x}{i}=\frac{(x+2)\times (x-1)}{2}$ ，此时未被任何素数筛选，所有数都符合要求。

若 $y$ 为合数，则 $S (x, y) = S (x, y - 1)$ 。因为素数列表和筛选范围都没有发生变化。

若 $y$ 为素数，且 $y^2 > x$ ，则 $S (x, y) = S (x, y - 1)$ 。因为任何数 $p$ 的因数都不大于 $\sqrt{p}$ ，而 $\sqrt{x}$ ，因此 $y$ 不可能是 $[2, x]$ 中任何数的最小素因数。

现在讨论最后一种情况，若 $y$ 为素数，且 $y^2 \leq x$ 。

考虑 $S (x, y)$ 相比于 $S (x, y - 1)$ 多筛去了哪些数，即 $[2, x]$ 中所有最小素因数为 $y$ 的数。

这些数可以表示为 $y\times z_i$ ，其中 $z_i\in [2,\lfloor\frac{x}{y}\rfloor]$ ，且 $z_i$ 的最小素因数不小于 $y$ 。

而根据 $T (x, y)$ 的性质， $T(\lfloor\frac{x}{y}\rfloor,y-1)$ 为所有最小素因数大于 $y - 1$ 或其本身为素数的数的集合。

因而 $z_i\in T(\lfloor\frac{x}{y}\rfloor,y-1)$ ，且 $\{z_i\} + \{prime \leq y-1\} = T(\lfloor\frac{x}{y}\rfloor,y-1)$ ，而 $\sum\limits_{prime \leq y-1}{prime}$ 可以表示为 $S (y - 1, y - 1)$ 。

得到 $S(x,y)=S(x,y-1)-y\times (S(\lfloor\frac{x}{y}\rfloor,y-1)-S(y-1,y-1))$ 。

在这里插入图片描述

参考代码

C++11:

#include <bits/stdc++.h>
#include <bits/extc++.h>

typedef long long ll;
const ll MOD = 998244353;

ll N;
std::vector<ll> A;
__gnu_pbds::cc_hash_table<ll, ll> S;

int main() {
	scanf("%d", &N);
	ll r = sqrt(N);
	for (ll i = 1; i <= r; ++i)
		A.push_back(N / i);
	for (ll i = A.back() - 1; i >= 1; --i)
		A.push_back(i);
	for (auto i : A) 
		S[i] = (i + 2) % MOD * ((i - 1) % MOD) / 2;
	for (ll p = 2; p <= r; ++p) {
		if (S[p] != S[p - 1]) {
			ll sp = S[p - 1];
			ll pp = p * p;
			for (auto i : A) {
				if (i < pp) break;
				S[i] = ((S[i] - p * (S[i / p] - sp)) % MOD + MOD) % MOD;
			}
		}
	}
	printf("%lld\n", S[N]);
	return 0;
}

python3:

def Solve(n):
    r = int(n ** 0.5)
    V = [n // i for i in range(1, r + 1)]
    V += list(range(V[-1] - 1, 0, -1))
    S = {i : i * (i + 1) // 2 - 1 for i in V}
    tms = 0
    for p in range(2, r + 1):
        if S[p] != S[p - 1]:
            sp = S[p - 1]
            p2 = p * p
            for v in V:
                if v < p2: break
                S[v] -= p * (S[v // p] - sp)
    return S[n]

if __name__ == '__main__':
    print(Solve(int(input())) % 998244353)