找1~N的所有素数(逐步优化代码)

最新推荐文章于 2023-12-26 17:48:15 发布

m0_74758366

最新推荐文章于 2023-12-26 17:48:15 发布

阅读量422

点赞数

分类专栏： C 数据结构与算法文章标签： c++ 算法数据结构

本文链接：https://blog.csdn.net/m0_74758366/article/details/128815267

版权

数据结构与算法同时被 2 个专栏收录

29 篇文章 0 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

首先来看最朴实的算法：

#include<bits/stdc++.h>
using namespace std;

bool isPrime(int i)
{
	for(int k=2;k<i;k++)
	{
		if(i%k==0)
		return false;
	}
	return true;
}

int main()
{
	int n=1e6,a=3,count=1;
	double e=clock();
	for(int i=3;i<=n;i++)
		if(isPrime(i))
			count++;
	cout<<count<<endl;
	double s=clock();
	cout<<s-e<<"ms";
	return 0;
}

运行：

可以看到这种算法面对数据量稍微大一点的情况十分浪费时间

试除法优化

isPrime()函数优化

inline bool isPrime(int i)      //内联函数，以大空间换短时间
{
	int sq=sqrt(i);
//由于sqrt(i)的值不变，因此可以预处理一下，如果写成k<=sqrt(i)+1，则每次循环都要计算一遍。

	for(int k=3;k<=sq+1;k+=2)  //sq+1 多算一个数，防止出现误差
	{                          //k=3，k+=2 只除以奇数，因为素数一定是奇数（除了2）
		if(i%k==0)
		return false;
	}
	return true;
}

main()函数调整

int main()
{
	int n=1e6,a=3,count=1;    //count=1 因为已知2是质数，下面从3开始判断
	double e=clock();
	for(int i=3;i<=n;i+=2)    //和isPrime函数一样的道理，只判断3以及3以后的奇数
		if(isPrime(i))
			count++;
	cout<<count<<endl;
	double s=clock();
	cout<<s-e<<"ms";
	return 0;
}

运行：

这样处理之后的运算耗时是原来方法的千分之一。而且当数据的数量级 ≤ 1e6 时比埃氏筛法更快。

埃氏筛法

将数据量提高到1e7，上面这种方法就逐渐体现不出优势了。

#include<bits/stdc++.h>
using namespace std;

const int maxn=1e7;
bitset<maxn>pri;
//pri默认值为0，我们用0表示质数，用1表示合数 

int main()
{
	int n=maxn;
	int count=0;
	double s=clock();
	
	for(int i=2;i<=n/i;i++)
//下一层循环里 j=i*i，则这里必须写成i<=n/i（或者sqrt(n)+1），否则溢出
		for(int j=i*i;j<=n;j+=i)   
//j=i*i 优化前的写法其实是j=2*i，例如当i=2时，j=4,6,8,10……，pri[j]=1。
//2的倍数都要标记为合数，但是2本身不能标记为合数。详见说明
			if(!pri[j]) pri[j]=1;
			//意为：当且仅当pri[j]==0时，将其改为1 
				
	for(int k=2;k<=n;k++)
		if(!pri[k])
		    count++;

	cout<<count<<endl;
	double e=clock();
	cout<<e-s<<"ms";
	return 0;
}

对其中第二层for循环里的 j = i * i，这里做一下说明：

以 i=5 为例，若写成 j = 2 * i，则 j = 10，15，20，25……，但是我们发现，10 = 2*5，15 = 3*5，20 = 4*5 ，25 = 5*5……当 i = 2 时，10已经被标记为合数了，当 i = 3时，15已经被标记为合数了，当 i = 4 时，20已经被标记为合数了，当 i = 5时，25已经被标记为合数了……因此，实际上 j可以直接从 j = i * i 开始，这样写就优化了算法（不过由于未知原因，这样优化之后耗时变得不太稳定，大部分时候都在1000ms以内，有时甚至达到700ms，但偶尔会达到1100ms）

运行：

如果使用优化后的试除法，结果如下：

当然，即使是在埃氏筛法里，试除法里运用的优化技巧也是可以生效的，例如第一层循环里i<=n/i也可以采用预处理的方法计算出sq=sqrt(n)+1，然后i<=sq。

看完上面所有内容，我们可以发现，基于埃氏筛法的优化，基本思路是减少当 i 不同时，其筛选的数的重复程度。例如上面提到的 j = i * i，它的作用就是减少了对同一个数筛选的次数（例如15会被3筛一次，还会被5筛一次），那么如果有一种筛法能使每个数只被筛选一次，它就必然优于埃氏筛法。

欧拉筛法（线性筛）

#include<bits/stdc++.h>
using namespace std;

const int maxn=1e7;
bitset<maxn>pri;
int primes[maxn],pp=0; //相比埃氏筛法多出来的

int main()
{
	int n=maxn;
	double s=clock();

	for(int i=2;i<=n;i++)    //从2开始遍历所有数据(注意与埃氏筛法里的sqrt相区分)
	{
		if(!pri[i])
			primes[++pp]=i;
		for(int j=1;primes[j]*i<=n;j++)	//遍历primes数组 
		{
			pri[primes[j]*i]=1;
			if(i%primes[j]==0)break;    //关键步，实现了一个数只筛一次
		}
	}

	double e=clock();
	cout<<pp;
	cout<<endl<<e-s<<"ms";
	return 0;
}