求素数(质数)

一、概念介绍

    大家中学都学过,就不过多介绍了,大致提两点:

  •     质数又称素数。一个大于1的自然数,除了1和它自身外,不能被其他自然数整除的数叫做质数;否则称为合数。
  •     0和1既不是质数也不是合数,最小的质数是2

 

二、方法介绍

1.最直观,但效率最低的写法


 
 
  1. public static boolean isPrime(int n){
  2. if (n <= 3) {
  3. return n > 1;
  4. }
  5. for( int i = 2; i < n; i++){
  6. if (n % i == 0) {
  7. return false;
  8. }
  9. }
  10. return true;
  11. }

    这里特殊处理了一下小于等于3的数,因为小于等于3的自然数只有2和3是质数。

    然后,我们只需要从2开始,一直到小于其自身,依次判断能否被n整除即可,能够整除则不是质数,否则是质数。

 

2.初步优化

    假如n是合数,必然存在非1的两个约数p1和p2,其中p1<=sqrt(n),p2>=sqrt(n)。由此我们可以改进上述方法优化循环次数。如下:


 
 
  1. public static boolean isPrime(int n) {
  2. if (n <= 3) {
  3. return n > 1;
  4. }
  5. int sqrt = ( int)Math.sqrt(n);
  6. for ( int i = 2; i <= sqrt; i++) {
  7. if(n % i == 0) {
  8. return false;
  9. }
  10. }
  11. return true;
  12. }

 

3.继续优化

    我们继续分析,其实质数还有一个特点,就是它总是等于 6x-1 或者 6x+1,其中 x 是大于等于1的自然数。

    如何论证这个结论呢,其实不难。首先 6x 肯定不是质数,因为它能被 6 整除;其次 6x+2 肯定也不是质数,因为它还能被2整除;依次类推,6x+3 肯定能被 3 整除;6x+4 肯定能被 2 整除。那么,就只有 6x+1 和 6x+5 (即等同于6x-1) 可能是质数了。所以循环的步长可以设为 6,然后每次只判断 6 两侧的数即可。


 
 
  1. public static boolean isPrime(int num) {
  2. if (num <= 3) {
  3. return num > 1;
  4. }
  5. // 不在6的倍数两侧的一定不是质数
  6. if (num % 6 != 1 && num % 6 != 5) {
  7. return false;
  8. }
  9. int sqrt = ( int) Math.sqrt(num);
  10. for ( int i = 5; i <= sqrt; i += 6) {
  11. if (num % i == 0 || num % (i + 2) == 0) {
  12. return false;
  13. }
  14. }
  15. return true;
  16. }

    对于输入的自然数 n 较小时,也许效果不怎么明显,但是当 n 越来越大后,该方法的执行效率就会越来越明显了。
**另外一种解释**

**定义:约数只有1和本身的整数称为质数,或称素数。**
**计算机或者相关专业,基本上大一新生开始学编程都会接触的一个问题就是判断质数,下面分享几个判断方法,从普通到高效。**

1)直观判断法

最直观的方法,根据定义,因为质数除了1和本身之外没有其他约数,所以判断n是否为质数,根据定义直接判断从2到n-1是否存在n的约数即可。C++代码如下:


    
    
  1. bool isPrime_1( int num )
  2. {
  3. int tmp =num- 1;
  4. for( int i= 2;i <=tmp; i++)
  5. if(num %i== 0)
  6. return 0 ;
  7. return 1 ;
  8. }

2)直观判断法改进

上述判断方法,明显存在效率极低的问题。对于每个数n,其实并不需要从2判断到n-1,我们知道,一个数若可以进行因数分解,那么分解时得到的两个数一定是一个小于等于sqrt(n),一个大于等于sqrt(n),据此,上述代码中并不需要遍历到n-1,遍历到sqrt(n)即可,因为若sqrt(n)左侧找不到约数,那么右侧也一定找不到约数。C++代码如下:

    
    
  1. bool isPrime_2( int num )
  2. {
  3. int tmp = sqrt( num);
  4. for( int i= 2;i <=tmp; i++)
  5. if(num %i== 0)
  6. return 0 ;
  7. return 1 ;
  8. }

3)另一种方法

方法(2)应该是最常见的判断算法了,时间复杂度O(sqrt(n)),速度上比方法(1)的O(n)快得多。最近在网上偶然看到另一种更高效的方法,暂且称为方法(3)吧,由于找不到原始的出处,这里就不贴出链接了,如果有原创者看到,烦请联系我,必定补上版权引用。下面讲一下这种更快速的判断方法;
首先看一个关于质数分布的规律:大于等于5的质数一定和6的倍数相邻。例如5和7,11和13,17和19等等;

证明:令x≥1,将大于等于5的自然数表示如下:
······ 6x-1,6x,6x+1,6x+2,6x+3,6x+4,6x+5,6(x+1),6(x+1)+1 ······
可以看到,不在6的倍数两侧,即6x两侧的数为6x+2,6x+3,6x+4,由于2(3x+1),3(2x+1),2(3x+2),所以它们一定不是素数,再除去6x本身,显然,素数要出现只可能出现在6x的相邻两侧。这里有个题外话,关于孪生素数,有兴趣的道友可以再另行了解一下,由于与我们主题无关,暂且跳过。这里要注意的一点是,在6的倍数相邻两侧并不是一定就是质数。
此时判断质数可以6个为单元快进,即将方法(2)循环中i++步长加大为6,加快判断速度,原因是,假如要判定的数为n,则n必定是6x-1或6x+1的形式,对于循环中6i-1,6i,6i+1,6i+2,6i+3,6i+4,其中如果n能被 6i,6i+2,6i+4整除,则n至少得是一个偶数,但是6x-1或6x+1的形式明显是一个奇数,故不成立;另外,如果n能被6i+3整除,则n至少能被3整除,但是6x能被3整除,故6x-1或6x+1(即n)不可能被3整除,故不成立。综上,循环中只需要考虑6i-1和6i+1的情况,即循环的步长可以定为6,每次判断循环变量k和k+2的情况即可,理论上讲整体速度应该会是方法(2)的3倍。代码如下:

    
    
  1. bool isPrime_3( int num )
  2. {
  3. //两个较小数另外处理
  4. if(num == 2|| num== 3 )
  5. return 1 ;
  6. //不在6的倍数两侧的一定不是质数
  7. if(num % 6!= 1&&num % 6!= 5)
  8. return 0 ;
  9. int tmp = sqrt( num);
  10. //在6的倍数两侧的也可能不是质数
  11. for( int i= 5;i <=tmp; i+= 6 )
  12. if(num %i== 0||num %(i+ 2)== 0 )
  13. return 0 ;
  14. //排除所有,剩余的是质数
  15. return 1 ;
  16. }
算法性能测试:
编写测试代码,使用较多数据测试比较几种方法的判断效率,数据量40w,代码如下:

    
    
  1. #include <iostream>
  2. #include <string>
  3. #include <ctime>
  4. #include <vector>
  5. using namespace std;
  6. bool isPrime_1( int num );
  7. bool isPrime_2( int num );
  8. bool isPrime_3( int num );
  9. int main()
  10. {
  11. int test_num = 400000;
  12. int tstart ,tstop; //分别记录起始和结束时间
  13. //测试第一个判断质数函数
  14. tstart=clock ();
  15. for( int i= 1;i <=test_num; i++)
  16. isPrime_1(i );
  17. tstop=clock ();
  18. cout<< "方法(1)时间(ms):" <<tstop- tstart<< endl ; //ms为单位
  19. //测试第二个判断质数函数
  20. tstart=clock ();
  21. for( int i= 1;i <=test_num; i++)
  22. isPrime_2(i );
  23. tstop=clock ();
  24. cout<< "方法(2)时间(ms):" <<tstop- tstart<< endl ;
  25. //测试第三个判断质数函数
  26. tstart=clock ();
  27. for( int i= 1;i <=test_num; i++)
  28. isPrime_3(i );
  29. tstop=clock ();
  30. cout<< "方法(3)时间(ms):" <<tstop- tstart<< endl ;
  31. cout<< endl ;
  32. system( "pause" );
  33. return 0 ;
  34. }

运行结果如下;


可以看出,判断到40w,效率上方法(1)明显要差得多,方法(2)和方法(3)在这种测试数量下时间相差2倍多

单独对比方法(2)和(3),数据量加到1000w,结果如下:

可以看出,方法(2)和方法(3)在这种测试数量下时间相差依然是2倍多,不过已经是很不错的提升。
对了,附上运行环境,CPU-i5-3210,内存4G,win7,vs2012。

好了,判断质数的方法暂时就到这里,不足之处欢迎各道友指出。





    • 2
      点赞
    • 1
      收藏
      觉得还不错? 一键收藏
    • 2
      评论

    “相关推荐”对你有帮助么?

    • 非常没帮助
    • 没帮助
    • 一般
    • 有帮助
    • 非常有帮助
    提交
    评论 2
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包
    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值