一:素数的概念
素数就是除了1和它本身再也没有其他因数的数, 例如数字7只能被1和7整除,所以数字7是素数。与素数相对的是合数,合数是出去1和它本身还有别的因数的数。
二:寻找素数的一般实现
假如我们要去寻找100以内的所有素数,那么很自然的我们就会有以下代码:
def solve(n):
primes = []
status = True
for i in range(1, n):
for j in range(2, i):
if i % j == 0:
status = False # i不是素数
break
if status: # status为True表示这个数是素数
primes.append(i)
status = True
return primes
当然我们可以利用一系列的规则对上述代码进行优化,例如:
如果这个数是偶数,那么它一定不是素数
素数一定可以表示为6n-1或6n+1的形式
一个数n如果存在因数,那么因数必然成对出现,并且一个小于等于sqrt(n), 一个大于等于sqrt(n)
利用上述规则,我们可以得到改进版的代码:
def solve(n):
primes = [1]
status = True
for i in range(2, n):
if i % 2 == 0 and i != 2: # 是偶数则一定不是素数
continue
if i % 6 not in (1, 5) and i not in (2, 3): # 不能表示为6n+1或6n-1的形式一定不是素数
continue
for j in range(2, int(math.sqrt(i))+1): # 因数成对存在,所以只需要在sqrt(i)+1中寻找
if i % j == 0:
status = False
break
if status:
primes.append(i)
status = True
return primes
上述代码将时间复杂度由之前的O(n^2)变为O(nlogn), 效率有了很大的提高,但是当n足够大时,我们依然有更好的实现:埃氏筛法
三:埃氏筛法
埃氏筛法的过程:埃氏筛法利用我们选出的素数去筛选其余的素数,当我们选定一个素数时, 剩余数据中能够被这个素数整除的数据一定不是素数。例如当n=20时,我们选的第一个素数为2(1是素数,但它不可取), 然后剩余数据3-20中能够被2整除的数据不是素数,利用2筛选后,我们在剩余的数据中选出的第一个素数为3, 然后同样的方法, 4-20中能够被3整除的数据不是素数,依次类推。
代码如下:
def solve(n):
primes = [1]
is_prime = [True] * (n+1) # is_prime[i]表示i是否是素数
for i in range(2, n+1):
if is_prime[i]: # 判断是否是素数
primes.append(i)
for j in range(i*2, n+1, i):
is_prime[j] = False # 能够被i整除的不是素数
return primes
上述代码的时间复杂度为O(nlnlnn), 已经非常接近O(n)