首先来看最朴实的算法:
#include<bits/stdc++.h>
using namespace std;
bool isPrime(int i)
{
for(int k=2;k<i;k++)
{
if(i%k==0)
return false;
}
return true;
}
int main()
{
int n=1e6,a=3,count=1;
double e=clock();
for(int i=3;i<=n;i++)
if(isPrime(i))
count++;
cout<<count<<endl;
double s=clock();
cout<<s-e<<"ms";
return 0;
}
运行:
可以看到这种算法面对数据量稍微大一点的情况十分浪费时间
试除法优化
isPrime()函数优化
inline bool isPrime(int i) //内联函数,以大空间换短时间
{
int sq=sqrt(i);
//由于sqrt(i)的值不变,因此可以预处理一下,如果写成k<=sqrt(i)+1,则每次循环都要计算一遍。
for(int k=3;k<=sq+1;k+=2) //sq+1 多算一个数,防止出现误差
{ //k=3,k+=2 只除以奇数,因为素数一定是奇数(除了2)
if(i%k==0)
return false;
}
return true;
}
main()函数调整
int main()
{
int n=1e6,a=3,count=1; //count=1 因为已知2是质数,下面从3开始判断
double e=clock();
for(int i=3;i<=n;i+=2) //和isPrime函数一样的道理,只判断3以及3以后的奇数
if(isPrime(i))
count++;
cout<<count<<endl;
double s=clock();
cout<<s-e<<"ms";
return 0;
}
运行:
这样处理之后的运算耗时是原来方法的千分之一 。而且当数据的数量级 ≤ 1e6 时比埃氏筛法更快。
埃氏筛法
将数据量提高到1e7,上面这种方法就逐渐体现不出优势了。
#include<bits/stdc++.h>
using namespace std;
const int maxn=1e7;
bitset<maxn>pri;
//pri默认值为0,我们用0表示质数,用1表示合数
int main()
{
int n=maxn;
int count=0;
double s=clock();
for(int i=2;i<=n/i;i++)
//下一层循环里 j=i*i,则这里必须写成i<=n/i(或者sqrt(n)+1),否则溢出
for(int j=i*i;j<=n;j+=i)
//j=i*i 优化前的写法其实是j=2*i,例如当i=2时,j=4,6,8,10……,pri[j]=1。
//2的倍数都要标记为合数,但是2本身不能标记为合数。详见说明
if(!pri[j]) pri[j]=1;
//意为:当且仅当pri[j]==0时,将其改为1
for(int k=2;k<=n;k++)
if(!pri[k])
count++;
cout<<count<<endl;
double e=clock();
cout<<e-s<<"ms";
return 0;
}
对其中第二层for循环里的 j = i * i,这里做一下说明:
以 i=5 为例,若写成 j = 2 * i,则 j = 10,15,20,25……,但是我们发现,10 = 2*5,15 = 3*5,20 = 4*5 ,25 = 5*5……当 i = 2 时,10已经被标记为合数了,当 i = 3时,15已经被标记为合数了,当 i = 4 时,20已经被标记为合数了,当 i = 5时,25已经被标记为合数了……因此,实际上 j可以直接从 j = i * i 开始,这样写就优化了算法(不过由于未知原因,这样优化之后耗时变得不太稳定,大部分时候都在1000ms以内,有时甚至达到700ms,但偶尔会达到1100ms)
运行:
如果使用优化后的试除法,结果如下:
当然,即使是在埃氏筛法里,试除法里运用的优化技巧也是可以生效的,例如第一层循环里i<=n/i也可以采用预处理的方法计算出sq=sqrt(n)+1,然后i<=sq。
看完上面所有内容,我们可以发现,基于埃氏筛法的优化,基本思路是减少当 i 不同时,其筛选的数的重复程度。例如上面提到的 j = i * i,它的作用就是减少了对同一个数筛选的次数(例如15会被3筛一次,还会被5筛一次),那么如果有一种筛法能使每个数只被筛选一次,它就必然优于埃氏筛法。
欧拉筛法(线性筛)
#include<bits/stdc++.h>
using namespace std;
const int maxn=1e7;
bitset<maxn>pri;
int primes[maxn],pp=0; //相比埃氏筛法多出来的
int main()
{
int n=maxn;
double s=clock();
for(int i=2;i<=n;i++) //从2开始遍历所有数据(注意与埃氏筛法里的sqrt相区分)
{
if(!pri[i])
primes[++pp]=i;
for(int j=1;primes[j]*i<=n;j++) //遍历primes数组
{
pri[primes[j]*i]=1;
if(i%primes[j]==0)break; //关键步,实现了一个数只筛一次
}
}
double e=clock();
cout<<pp;
cout<<endl<<e-s<<"ms";
return 0;
}