素数基础篇 之 素数的个数 - czyuan原创

上一篇我们对素数的基本判断方法进行了介绍(素数基础篇 之 素数的判断 - czyuan原创
      http://hi.baidu.com/czyuan_acm/blog/item/8a6f7d88187acd9fa4c2721f.html )

     了解了基本的判断方法后,你是不是有个疑问:“我们能判断素数的个数吗?”总所周知,素数的个数是无限的,且没有固定的公式…但如果我们只要判断[a, b]区间(a, b范围为1到1亿)内的素数的个数呢?

     首先,我们可以想到,如果要求的素数个数区间[a, b],当区间长度比较小(10^6内),我们可以用筛法求出区间内的所有的素数,然后统计个数即可。
但如果区间长度很长或者要求询问的次数很多,那该怎么办呢? [a,b]区间内素数的个数 = [1, b]的个数 - [1, a - 1]的个数,所以我们这里只讨论求[1, a]区间内的素数。以下提供个人的两种方法,时限都是1s内产生结果。如果哪位大牛有更好的方法,大家一起交流下~~

     1. 我们可以扩展上面的思想,当区间小的时候,我们可以很好的求出素数的个数。那我们可以把大的区间划分成一块块小的区间,比如把一个长度为1亿的区间划分1,000个长度为100,000的区间。我们可以利用Miller-Rabin事先把[1, 100000], [100001, 200000], [200001, 300000]的区间内的素数个数统计好,然后存在一个数组中。
完成这步后,思路就比较清晰:对于区间[1, a],可以拆分为一个个长度为100000的小区间([1, 100000], [100001, 200000]…),加上尾部的小区间[c * 100000, a]。前面的小区间只要数组的值相加即可,而后面的小区间[c * 100000, a],长度在100000内,直接用区间的筛法求出素数,统计个数即可。
     代码:参见上一篇文章的Miller-Rabin,区间求素数的代码。
     该方法速度很快,主要时间都花在数组打表上,然后直接存在数组里,求1到1亿的素数个数时间为0.06s。
     评价:优点是方法速度快,且直接套模板即可。缺点是需要事先打表,且代码长度很长(因为要给长度为1000的数组赋初值)。

     2. 第二种方法涉及到容斥原理(inclusion-exclusion principle),容斥原理参见( http://en.wikipedia.org/wiki/Inclusion-exclusion_principle )。
      当一个数是合数,那么它可以分解成几个素数的乘积。如30 = 2 * 3 * 5。我们可以统计合数的个数,然后拿总数减它就是素数的个数(注意还要去掉1的)。我们可以利用类似筛法的原理,去除2的倍数(它们肯定是合数,不包括2),然后去除3的倍数,5的倍数,知道去除到Sqrt(a)的倍数为止。但你会发现6 = 2 * 3,被去除了2次,而这正是容斥原理解决的问题。合数的个数 = 1个素数筛完的合数个数 – 2个素数筛完的合数个数 + 3个素数筛完的合数个数...
而容斥原理的累加过程,即可用DFS来解决。你可能会认为sqrt(1亿) = 10000,其中素数有很多,DFS要跑很长时间。但我们只需要加一些简单的优化即可很大程度地提高程序的效率。

    首先,我们写筛法出1到sqrt(a)的素数表,然后从小到大DFS。
    如果当前的乘积 > a,那么直接退到上一层。
    如果该层的所有乘积不能使总数发生变化(即所有乘积都 > a),那么直接退回第一层。(因为是从小到大,该层下面的乘积必将 > a)
    如果是第一层的所有乘积不能使总数发生变化,那么程序运行结束。(原理同上)
    经过这样优化后,求1到1亿的时间为0.4秒,1到10亿的时间为3.5s。

     核心代码:
     void Solve(int index, int lcm, int K)
     {
         int i;
         int t, t_temp;
         if (K == 0)
         {
              temp += n / lcm;
               return ;
         }
         for (i = index; i < total - K + 1; i++)
         {
               t = lcm * primelist[i];
               t_temp = temp;
               if (t <= n)
               {
                  Solve(i + 1, t, K - 1);
               }
               if (t_temp == temp) return ; // 剪枝:同样道理,说明以后的K - 1个不能组成我们想要的值
          }
    }

    main()中:
    for (k = 1; k <= total; k++)
    { // 计算size中选k个的总数.
          temp = 0;
          Solve(0, 1, k);
          if (temp == 0) break; // 说明最小的k个乘积都大于n了,那么可以直接break了.
          if (k & 1) ans += temp;
          else ans -= temp;
    }

    评价:该方法巧妙地使用了容斥原理来计数,且DFS应用于容斥原理的剪枝十分重要。
     
    提到容斥原理,推荐一道前不久做的题目SRM 453.5 DIV 1 1000( http://www.topcoder.com/stat?c=problem_statement&pm=10420&rd=14174 ),两题的容斥原理思想差不多,但剪枝方法不同,而且两题的方法交换都会产生超时...(有兴趣一起交流下~~)

czyuan原创,转载请注明出处

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值