先来说一说N方筛素数
a[1]=1;
for (int i=2;i<=n;i++)
{
if (a[i]==0)
for (int j=2;j<=n/i;j++)
a[i*j]=1;
}
线性筛素数和N方筛素数最大的差别就在于线性筛素数可以同过i%prime[j]来达到线性,其本质的思想就是用最小质因数来筛。
为什么一定用的是最小质因数,下文会讲。
先上代码:
a[1]=1;pri=0;
for (int i=2;i<=n;i++)
{
if (!a[i])
prime[++pri]=i;
for (int j=1;j<=pri && i*prime[j]<=n;j++)
/*这个 i*prime[j]<=n 一定要写在循环头部内
一是防止数组越界
二是表示之后的素数也没必要处理了省下一波时间*/
{
a[i*prime[j]]=1;
if (!(i%prime[j]))break;
}
}
证明一下下面这段代码的正确性
if (!(i%prime[j]))break;
上面提到过,要筛出某一个合数A,就要用利用到其最小质因数,其实是其最小质因数与另一个数(不管是质数还是合数)的乘积
对于任意数正数A,若A=x*y(其中x为素数,y为当前正在处理的数)
要想x是A的最小质因数,就必须使y的最小质因数为x,否则在上面正在证明的代码中prime[j]不会到x就会退出循环,因为发现了比x还小的质因数。
这个算法也不用担心一个合数A已经正在被处理(i=A时)也没有被筛出来,因为最小的素数都是2,一个大于2的数乘2肯定比它加1要大。也不用担心有素数筛不出来,因为一个数如果没有被筛到,就说明它除了自己外没有质因数,表明他就是个素数。
对于时间复杂度,因为每一个数都是由其最小的质因数与一个合数的乘积组成,每个数的最小质因数只有一个(不可能说一个数的最小质因数既是2又是3吧),所以每个数被访问到的次数就只有一次。
但是对于时间复杂度还有一点说明(都是血的教训啊):就是i*prime[j]<=n如果不写在循环头部,而作为判断条件写在循环体内与a[i*prime[j]]=i同一行,是可以防止数组越界,但是可能就有了对prime[j]之后的素数的无效处理,增加循环量。注意一点,如果是这么写的话,其实和上面说的n方筛素数的区别就只有下面那个退出循环的判断,加入那个判断不好使,算法就有可能退化成n方的。