C/C++/Java/Go/Rust,Python喊你来打擂:3秒钟内统计出小于1亿的素数个数

前几天,有个非计算机专业的同学问我,如何快速找出1亿之内的孪生素数——所谓孪生素数,就是差值为2的两个素数。原本以为这是一个很简单的问题,随便用python写了一个方法,没想到却要跑17分钟左右。改用C++试试,受限于我对C/C++的理解程度,仍然慢得无法承受(此处绝无小视C++之意)。这个问题激起了我的兴趣。于是乎,我花了半天时间,尝试了几种方式,最终又对代码做了优化,终于在3秒钟内找出了小于1亿的素数表。

略微得意了3秒钟,突然想到,Python 这个速度究竟是什么水平呢?用 C/C++/Java/Go/Rust 等语言实现起来会不会更快呢?如果大家一起来个擂台赛,会不会很热闹?各位 C/C++/Java/Go/Rust 的高手们,有兴趣一起搞个擂台赛吗?没准儿,CSDN会为这个活动设置奖项呢(哈哈哈。。。)

11月6日追记:今天,有几位朋友在评论区留言,冷嘲热讽,不太友好。一开始我还逐一认真回复,后来想,算了,统一在这里说一下吧:1. 作为从业二十余年的老程序员,从事科学计算多年,深知C/C++语言的效率,也了解目前数学运算的速度,如各位担心我忘记了,请尽量心平气和地提醒我;2. 本文写作的目的,仅仅是出于探讨如何提高python计算速度的目的,并没有轻视某种语言,且在开篇已经声明;3. 所有人都知道速度是python的短板,之所以取这样的名字,不否认有博眼球的用意,但也是想给CSDN提个建议,搞一些跨界活动,给大家弄点纪念品;4. 作为脚本语言python能跑出2.4秒的成绩,你用C++也是2点几秒,即使更快,似乎也没有蔑视嘲讽他人的资格;5. 我已过知天命之年,再激烈的言辞也可以接受,不会删除评论,最大限度尊重言论自由,也请评论者尽量保持平和的心态。

1. 找出1百万以内的质数,大约3秒钟

咸盐稍许,先给出我的最原始的算法。运行 prime_1.py,找出100万以内的质数,大约3秒钟。不要试图尝试更大范围的寻找,那会花更长的时间,长到你无法忍受。

prime_1.py

# -*- coding: utf-8 -*-

import sys, time
from math import sqrt

def find_prime(upper):
    """找出小于upper的所有质数"""
    
    prime_list = list() # 存放找到的质数
    for i in range(2, upper): # 从2开始,逐一甄别是否是质数
        is_prime = True # 假设当前数值i是质数
        for p in prime_list: # 遍历当前已经找到的质数列表
            if i%p == 0:
                is_prime = False
                break
            elif p > sqrt(i):
                break
        
        if is_prime:
            prime_list.append(i)
    
    return prime_list

upper = 1000000
t0 = time.time()
prime_list = find_prime(upper)
t1 = time.time()
print('查找%d以内的质数耗时%0.3f秒,共找到%d个质数'%(upper, t1-t0, len(prime_list)))

2. 找出1千万以内的质数,大约12秒钟

3秒钟找出100万以内的质数,这个效率,显然无法用于查找1亿以内的素数。下面的代码,我使用了numpy这个科学计算库,速度提升明显。运行 prime_2.py,找出1千万以内的质数,大约12秒钟。不过要是用它来查找1亿以内的质数,至少需要15分钟。

prime_2.py

# -*- coding: utf-8 -*-

import sys, time
import numpy as np

"""
网上有文章说,python最强找质数程序,寻找10万以内质数只要30秒哦!

运行一下我们这个脚本,找出1千万内的质数,大约11秒
不要尝试找出1亿内的质数,你等不到结果。别说我没告诉你!!!
"""

def find_prime(upper):
    """找出小于upper的所有质数"""
    
    prime_list = list() # 空数组,用于存放找到的质素
    mid = int(np.sqrt(upper)) # 判断100是否是质数,只需要分别用2,3...等质素去除100,看能否被整除,最多做到100的平方福根就够了
    nums = np.arange(upper) # 生成0到上限的数组,数组元素的值等于其索引号,相对于python的[0,1,2,3,...]
    nums[1] = 0 # 数组第1和元素置0,从2开始,都是非0的
    
    while True: # 循环
        primes = nums[nums>0] # 找出所有非0的元素
        if primes.any(): # 如果能找到
            p = primes[0] # 则第一个元素为质数
            prime_list.append(p) # 保存第一个元素到返回的数组
            nums[p::p] = 0 # 这个质数的所有倍数,都置为0(表示非质素)
            if p > mid: # 如果找到的质数大于上限的平方根
                break # 则退出循环
        else:
            break # 全部0,也退出循环
    
    prime_list.extend(nums[nums>0].tolist()) # nums里面剩余的非0元素,都是质数,合并到返回的数组中
    return prime_list # 返回结果

upper = 10000000
t0 = time.time()
prime_list = find_prime(upper)
t1 = time.time()
print('查找%d以内的质数耗时%0.3f秒,共找到%d个质数'%(upper, t1-t0, len(prime_list)))

3. 找出1亿以内的质数,耗时不到3秒钟!

上面的代码还有优化的空间吗?经过分析发现,numpy 的 ndarray 对象,其元素数量超过一定范围后,效率明显变慢。针对这一点,我做了分块优化。运行 prime_3.py,找出1亿以内的质数,耗时不到3秒钟!

prime_3.py

# -*- coding: utf-8 -*-

import sys, time
import numpy as np

"""
网上有文章说,python最强找质数程序,寻找10万以内质数只要30秒哦!

运行一下我们这个脚本,找出1亿以内的质数,耗时不到3秒,比上面快了大约1万倍
还可以尝试更大的范围,但步子不要太大!!!
"""

def find_prime(upper):
    """找出小于upper的所有质数"""
    
    prime_list = list()
    mid = int(np.sqrt(upper))
    nums = np.arange(upper)
    nums[1] = 0
    
    while True:
        primes = nums[nums>0]
        if primes.any():
            p = primes[0]
            prime_list.append(p)
            nums[p::p] = 0
            if p > mid:
                break
        else:
            break
    
    prime_list.extend(nums[nums>0].tolist())
    return prime_list

def fast_find_prime(upper, base=100000, block=20000000):
    """快速找出小于upper的所有质数"""
    
    if upper <= base:
        return find_prime(upper)
        
    mid = int(np.sqrt(upper))
    prime_list = find_prime(base)
    prime_array = np.array(prime_list)
    prime_array = prime_array[prime_array<=mid]
    
    start = base
    while start < upper:
        end = start + block
        if end > upper:
            end = upper
        print((start, end))
        
        prime_list.extend(process_func(start, np.copy(prime_array), (start, end)))
        start += block
    
    return prime_list


def process_func(id, primes, task_range):
    """执行分块任务的函数
    
    primes      - 用以剔除非质数的质数表
    task_range  - 分块任务的数值范围
    """
    
    nums = np.arange(task_range[0], task_range[1])
    for p in primes:
        k = (p-task_range[0]%p)%p
        nums[k::p] = 0
    
    return nums[nums>0].tolist()

upper = 100000000
t0 = time.time()
prime_list = fast_find_prime(upper)
t1 = time.time()
print('查找%d以内的质数耗时%0.3f秒,共找到%d个质数'%(upper, t1-t0, len(prime_list)))

后记

近期有很多朋友通过私信咨询有关Python学习问题。为便于交流,我在CSDN的app上创建了“Python作业辅导”大本营,面向Python初学者,为大家提供咨询服务、辅导Python作业。欢迎有兴趣的同学使用微信扫码加入。

在这里插入图片描述

从博客到公众号,每一篇、每一题、每一句、每一行代码,都坚持原创,绝不复制抄袭,这是我坚守的原则。如果喜欢,请关注我的微信公众号“Python作业辅导员”。

在这里插入图片描述

  • 178
    点赞
  • 391
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 78
    评论
评论 78
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

天元浪子

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值