AKS算法
CSDN内嵌LaTex不支持align环境,所以一些数学排版不好看,不爽哦。
\quad
近几年最著名的就算AKS算法了。由三个印裔的哥们设计的(算法的名称取自他们的首字母)。所以几年前就翻译了这篇论文。中文翻译过来大意叫做在多项式时间内的素性确定算法。其实算法本身并不复杂,理解起来也不难。但是其中有一个多项式消减问题。期间大概花了一个小时左右写好了算法流程本身。然而多项式消减这个操作我陆陆续续写了两周
左右。这里是程序的下载地址 https://github.com/gA4ss/MyAKS.git
\quad
其实本来也花不到那么长的时间,只是范了程序员的通病,慢慢的把一个小程序越写越大,到基本功能完成时写了
2000
2000
2000行左右的_python_代码(如果用_C/C++_的话,应该在
3000
3000
3000行左右)。实现了一个简易的符号系统(其中对外的输出使用Latex的数学公式表示),可以做二项式展开,多项式合并,以及多项式的加减乘除操作。在上周天的感觉在数值为分数时自动配方不是很好,又重写了一个叫做_yvalue_的数值类,把浮点数与整数在保存时,就转化成分数的形式。在求值时才展开。还可以处理类似
15
47
5
7
\frac{\frac{15}{47}}{\frac{5}{7}}
754715这样的形式。连分数的处理是OK的。
多项式的消减的逻辑还是很烧脑的。本来AKS只需要一个一元
n
n
n次的展开即可,出于一个程序员的态度
,我还是完成了多元多次式的运算。下图显示了。
P
2
(
m
o
d
P
3
)
P2 \pmod{P3}
P2(modP3)后的商式
P
4
_
q
P4\_q
P4_q与余式
P
4
_
r
P4\_r
P4_r。其中
P
2
P2
P2是
(
x
+
a
)
7
(x+a)^7
(x+a)7展开后的结果。
下图是我实现的AKS算法的流程输出,感觉可以当做教学课件了。现在网上基本找不到AKS的完整真正实现,有些实现都是直接把
X
X
X代入一个固定的数值,这样其实不能算是AKS算法,只能算是该算法的一个应用。这样在数值小的时候没问题,当要确定的一个数过大时就没有用了。其中多项式消减操作就是为了避免处理数值过大后大数运算带来的效率问题。
下图是程序的输出截图:
这份代码中,需要使用大数运算库gmpy2
的支持。运行环境为python34
和python27
。3.6目前不支持原因在于gmpy2
不支持3.6的版本。另外还需要说明的是程序有bug
没有修订,gmpy2
没有在所有的运算中使用,空了时间再填补上吧。
下面译文还有一些需要说明的是有些是我自己的注释,使用以下这种方式:
这里是我的注释
1.介绍
由于在现代密码学中需要非常大的素数来参与运算,所以素数的判定非常的重要。
我们使用PRIMES来代替素数集合。素数定义本身已经给出了一种算法来确定一个整数 n ∈ P R I M E S n \in PRIMES n∈PRIMES。尝试使用 n n n去除以每个整数 m ≤ ⌊ n ⌋ m \le \lfloor \sqrt{n} \rfloor m≤⌊n⌋,如果有任意 m m m可以整除 n n n。那么 n n n为合数。否则它是一个素数。
m ≤ ⌊ n ⌋ m \le \lfloor \sqrt{n} \rfloor m≤⌊n⌋。为什么 ⌊ n ⌋ \lfloor \sqrt{n} \rfloor ⌊n⌋是它的界限。一个很简单
的证明是,一个合数是最少两个素数相乘组成的。设 n = p q n = pq n=pq,其中 p = q p = q p=q,
那么设 p = q = n p = q = \sqrt{n} p=q=n;如果 p < q p < q p<q,那么 p < ⌊ n ⌋ p < \lfloor \sqrt{n} \rfloor p<⌊n⌋。如果假设
p > ⌊ n ⌋ p > \lfloor \sqrt{n} \rfloor p>⌊n⌋。那么 p q > n pq > n pq>n。所以与条件矛盾。
这种测试算法在古希腊被称为埃拉托色尼1 (ca. 240 BC)分解法。它需要遍历所有小于 n \sqrt{n} n的素数,这很低效,需要花费大概 Ω ( n ) \Omega(\sqrt{n}) Ω(n)步去决定 n n n是否是一个素数。一个更加有效的测试是基于费马小定理2:对于任意素数 p p p与一个任意不能整除它的整数 a a a,存在 a p − 1 ≡ 1 ( m o d p ) a^{p-1} \equiv 1 \pmod p ap−1≡1(modp)。给定一个整数 a a a去确定整数 n n n是否是一个素数时,需要对 a a a反复进行 ( n − 1 ) t h (n-1)^{th} (n−1)th次平方,但是,它仍然不是一个总是正确的测试,因为有些 a a a在 n n n是合数是也可以通过这个测试(这些 a a a被称作为卡米切尔数3)。无论如何,费马小定理都是有效素性测试算法的基础。
直到在1960年,复杂理论4出现,从而将问题的复杂性进行标准化并且将复杂性问题的种类进行了定义(例如素性测试就是一个复杂性问题)。素性测试才被重视起来。开始这个问题被认为是一个 c o − N P co-NP co−NP5问题:如果 n n n不是一个素数,那么 n n n拥有一个非平凡因子将很容易的被验证。在1974年,Pratt认为这个问题是一个 N P NP NP问题(因此将它放入 N P ∩ c o − N P NP \cap co-NP NP∩co−NP)。
在1975,Miller使用一个基于费马小定理的属性去证明扩展黎曼假设6。很快的他的测试被Rabin修改为一个无条件但是是随机多项式时间的算法。在1974年索洛韦和Strassen也独立的提出了一个不同的随机多项式时间算法,这个算法使用了一个素数 n n n,对于每一个 a a a存在 ( a n ) = a n − 1 2 ( m o d n ) {\left(a \over n \right)}=a^{{n-1}\over 2}\pmod n (na)=a2n−1(modn)( ( − ) \left(-\right) (−)是雅可比符号7)。他们的算法在扩展黎曼假设的条件下也可以直接确定素数。后来有基于不同特性的随机多项式时间测试素数的算法。
在1983年,Adleman,Pomerance,与 Rumely在素性测试方面取得了一个决定性的进展,这个算法可以运行在 ( l o g n ) O ( l o g l o g l o g n ) \left(logn\right)^{O(logloglogn)} (logn)O(logloglogn)时间(之前所有的算法都是在指数时间)。他们的算法(感觉上)是Miller算法的更加通用的形式并且使用更高级的相互作用规则。在1986年,Goldwasser与Kilian提出一个基于椭圆曲线8在大多数输入(所有的输入都被认为是合乎条件的)条件下可以运行在多项式时间。这使素性测试变得很容易(指导那时,所有的随机算法产生的验证结果都仅仅是复合性的)。基于他们的想法,一个类似的算法被Aktin发明。Adleman与Huang修改Goldwasser-Kilian的随机算法期望在所有的输入条件下运行在多项式时间。
一个无条件多项式时间确定素数的算法是这个研究的最终目标。尽管到现在这项研究已经取得了极大的成绩,但是离最终目标还有段距离。在这篇论文中,我们达到了最终目的。我们在确定一个数是否是素数在 O ∼ ( l o g 15 / 2 n ) O\sim\left(log^{15/2}n\right) O∼(log15/2n)时间内。在一些条件下,我们的算法会做的更好:普遍认为在苏菲日耳曼素9的密度下(如果素数 p p p那么 2 p + 1 2p+1 2p+1也是素数),我们的算法仅花费 O ∼ ( l o g 6 n ) O\sim\left(log^6n\right) O∼(log6n)步。我们的算法是基于在有限域多项式环的费马小定理。证明我们定理的正确性只需要一些简单的代数功能(除了在 p p p与 p − 1 p-1 p−1之间有一个非常大的素因子的筛选法的结果并且甚至不需要证明这个算法是工作在 O ∼ ( l o g 21 / 2 n ) O\sim\left(log^{21/2}n\right) O∼(log21/2n)这个很短的时间内)。之前的算法证明要复杂的多。
在第二节,我们简单阐述了这个算法的核心思想。在第三节,我们明确了一些标记的使用。在第四节,我们证明了这个算法的正确性。在第五个小节,我们分析这个算法的性能。在第六节我们探讨对这个算法优化的方法。
其实这节就是介绍一下多项式时间确定素数算法的在历史上的取得的进展。
2.核心思路
我们的测试是基于费马小定理。它也是随机多项式时间算法的基础。
这里我们先花些时间来探讨下费马小定理,这是很有必要的。
如果 p p p是一个素数,那么对于所有的整数 a a a,数 a p − a a^p-a ap−a是 p p p的整数倍。又可以表示为: a p ≡ a ( m o d p ) a^p \equiv a \pmod p ap≡a(modp)
举例说明,如果 a = 2 a=2 a=2并且 p = 7 p=7 p=7那么 2 7 = 128 2^7=128 27=128,并且 128 − 2 = 7 × 18 128 - 2 = 7 \times 18 128−2=7×18。
如果 a a a与 p p p互素,上边的等式可以两边消去一个 a a a则费马小定理的形式为 a p − 1 ≡ 1 ( m o d p ) a^{p-1} \equiv 1 \pmod p ap−1≡1(modp)
举例说明,如果 a = 2 a=2 a=2并且 p = 7 p=7 p=7,那么 2 6 = 64 2^6=64 26=64并且 64 − 1 = 63 64-1=63 64−1=63是 7 7 7的整数倍。
以上就是费马小定理的基本内容。论文中的第二节就是其使用多项式理论对其证明的一个过程。
引理 2.1 使
a
∈
Z
,
n
∈
N
,
n
≥
2
a \in \mathscr Z, n \in \mathscr N, n \ge 2
a∈Z,n∈N,n≥2并且
(
a
,
n
)
=
1
(a,n)=1
(a,n)=1。当且仅当
(
X
+
a
)
n
≡
X
n
+
a
(
m
o
d
n
)
(1)
(X+a)^n \equiv X^n + a \pmod n \tag{1}
(X+a)n≡Xn+a(modn)(1)
则
n
n
n是素数。
其实以上就是费马小定理的一般化形式。
证明: 循环遍历 0 < i < n 0 < i < n 0<i<n, x i x^i xi的系数在 ( ( X + a ) n − ( X n + a ) ) ((X+a)^n - (X^n + a)) ((X+a)n−(Xn+a))是 ( n i ) a n − i \binom{n}{i}a^{n-i} (in)an−i。
忘记组合公式的同学看这里: ( n i ) = n ! i ! ( n − i ) ! \binom{n}{i}={{n!} \over {i!(n-i)!}} (in)=i!(n−i)!n!
如果 n n n是一个素数。则 ( n i ) ≡ 0 ( m o d n ) \binom{n}{i} \equiv 0 \pmod n (in)≡0(modn) 因此所有的系数为0。
个人比较讨厌,没有来由的数学等式,那就让我们展开来讨论一下这个等式。在探讨之前先把二项式定理放到前面膜拜一
下牛顿他老人家。二项式展开式定理:令 x x x, y y y为实数, n n n是一个正整数。则
( x + y ) n = ∑ i = 0 n ( n i ) x i y n − i (x+y)^n = \sum_{i=0}^n\binom{n}{i}x^iy^{n-i} (x+y)n=i=0∑n(in)xiyn−i展开等式\eqref{e1}的左边得到如下的等式:
C n 0 a 0 X n + C n 1 a 1 X n − 1 + . . . + C n n − 1 a n − 1 X + C n n a n X 0 C_n^0a^0X^n+C_n^1a^1X^{n-1}+...+C_n^{n-1}a^{n-1}X+C_n^na^nX^0 Cn0a0Xn+Cn1a1Xn−1+...+Cnn−1an−1X+CnnanX0其中除了第一项与最后一项都不能被 n n n整除法,其余的项当模 n n n时,它们都被削减掉了。当削减掉中间的项后等式变成剩下的就是 X n + a n X^n+a^n Xn+an
如果 n n n是一个合数。假设 n n n的一个素因子 q q q并且使得 q k ∣ n q^k \mid n qk∣n。然而 q k q^k qk不能整除 ( n q ) \binom{n}{q} (qn)并且与 a n − q a^{n-q} an−q互素,因此 X q X^q Xq的系数非 0 ( m o d n ) 0 \pmod n 0(modn)。因此 ( ( X + a ) n − ( X n + a ) ) ((X+a)^n-(X^n+a)) ((X+a)n−(Xn+a))在模 n n n的环10 Z n Z_n Zn中为非 0 0 0。
以上的等式暗示了一个简单的素性测试方法:给定一个输入 n n n,选择一个数 a a a并且测试等式 ( 1 ) (1) (1)是否相等。但是,这需要花费 Ω ( n ) \Omega(n) Ω(n)。
Ω ( n ) \Omega(n) Ω(n)表示对于任意一个 c ≥ c 0 c \ge c_0 c≥c0,则 c 0 n ≤ f ( n ) c_0n \le f(n) c0n≤f(n)。
因为上述等式的系数项有 n n n个,最坏的情况是当模 n n n后(此时, n n n是
一个合数),每个系数项都为非 0 0 0。
因为在最坏的情况下计算左边等式
n
n
n个系数。一个简化方法是等式
(
1
)
(1)
(1)两边都模一个
X
r
−
1
X^r-1
Xr−1多项式,其中的
r
<
n
r < n
r<n。等同于测试如下等式:
(
X
+
a
)
n
=
X
n
+
a
(
m
o
d
X
r
−
1
,
n
)
(2)
(X+a)^{n}=X^{n}+a \pmod {X^r-1,n} \tag{2}
(X+a)n=Xn+a(modXr−1,n)(2)
根据引理 2.1,对于所有的
a
a
a与
n
n
n,当
n
n
n为素数时都满足等式
(
2
)
(2)
(2)。现在的问题是有很少的
a
a
a与
r
r
r在
n
n
n为合数时也满足此等式。
总体来说就是:我们选择一个合适的数 r r r,如果等式 ( 2 ) (2) (2)满足,那么对于一些少量的 a a a, n n n是合数,对于大量的 a a a与一个合适数 r r r关于在 l o g n log_n logn多项式时间有界,因此我们获得一个在多项式时间内确定素数的算法。
3.标记与预读
关于 P P P, N P NP NP以及 c o − N P co-NP co−NP问题的详细解释参见参考资料。
用
Z
n
Z_n
Zn表明模
n
n
n的环。
F
p
F_p
Fp是模
p
p
p的有限域11,其中
p
p
p是素数。
回想一下如果
p
p
p是素数,
h
(
X
)
h(X)
h(X)是一个在
F
p
F_p
Fp域的
d
d
d次可削减多项式,那么
F
p
[
X
]
/
(
h
(
X
)
)
F_p[X]/(h(X))
Fp[X]/(h(X))是以
p
d
p^d
pd为阶的有限域。我们将使用
f
(
X
)
=
g
(
X
)
(
m
o
d
h
(
X
)
,
n
)
f(X)=g(X) \pmod {h(X),n}
f(X)=g(X)(modh(X),n)来表示在环
Z
n
[
X
]
/
(
h
(
X
)
)
{Z_n[X]}/{(h(X))}
Zn[X]/(h(X))内的等式
f
(
X
)
=
g
(
X
)
f(X)=g(X)
f(X)=g(X)。
上述等式就是表示 f ( X ) f(X) f(X)与 g ( X ) g(X) g(X)首先对模 h ( X ) h(X) h(X)做削减操作,随后在做
模 n n n的操作,保证结果在环 Z n Z_n Zn中。
我们使用符号 O ( t ( n ) ) O~(t(n)) O (t(n))来表示 O ( t ( n ) ⋅ p o l y ( l o g t ( n ) ) ) O(t(n) \cdot poly(logt(n))) O(t(n)⋅poly(logt(n))),其中 t ( n ) t(n) t(n)表示变量 n n n的函数。例如, O ( l o g k n ) = O ( l o g k n ⋅ p o l y ( l o g l o g n ) ) = O ( l o g k + ϵ n ) O^~(log^{k}n)=O(log^{k}n \cdot poly(loglogn))=O(log^{k+\epsilon}n) O (logkn)=O(logkn⋅poly(loglogn))=O(logk+ϵn)对于任意一个 ϵ > 0 \epsilon > 0 ϵ>0。我们使用 l o g log log表示以 2 2 2为底的对数,自然对数使用 l n ln ln来表示。
N \mathscr N N与 Z \mathscr Z Z分别表明自然数集与整数集。给定 r ∈ N r \in \mathscr N r∈N, a ∈ Z a \in \mathscr Z a∈Z,其中 ( a , r ) = 1 (a,r)=1 (a,r)=1,其中 k k k是满足元素 a a a模 r r r群的最小的阶, a k ≡ 1 ( m o d r ) a^k \equiv 1 \pmod r ak≡1(modr)。它使用 o r ( a ) o_r(a) or(a)来表示。对于 r ∈ N r \in \mathscr N r∈N, ϕ ( r ) \phi(r) ϕ(r)是欧拉函数表示满足所有小于 r r r的素数的个数。其中对于每一个 a a a, ( a , n ) = 1 (a,n)=1 (a,n)=1,则 o r ( a ) ∣ ϕ ( r ) o_r(a) \mid \phi(r) or(a)∣ϕ(r)。
引理3.1 使用
L
C
M
(
m
)
LCM(m)
LCM(m)表示前
m
m
m数的最小公倍数。对于
m
≥
7
m \ge 7
m≥7:
L
C
M
(
m
)
≥
2
m
LCM(m) \ge 2^m
LCM(m)≥2m
4.算法与证明
输入一个大于1的正整数 n n n。
- 如果对于每一个 a ∈ N a \in \mathscr N a∈N与 b > 1 b > 1 b>1,则 n = a b n=a^b n=ab,输出合数。
- 找到一个最小的整数 r r r,使得 o r ( n ) > l o g 2 n o_r(n)>log^2n or(n)>log2n。
- 如果对于一些 a ≤ r a \le r a≤r,则 1 < ( a , n ) < n 1 < (a,n) < n 1<(a,n)<n,输出合数。
- 如果 n ≤ r n \le r n≤r,输出素数。
- 循环测试每一个 a = 1 a=1 a=1到 ⌊ ϕ ( r ) l o g n ⌋ \lfloor \sqrt{\phi(r)}logn \rfloor ⌊ϕ(r)logn⌋,如果 ( X + a ) n ≢ X n + a ( m o d X r − 1 , n ) (X+a)^n \not \equiv X^n + a \pmod {X^r - 1, n} (X+a)n≡Xn+a(modXr−1,n)输出合数。
- 输出素数。
定理 4.1 以上算法返回素数,当且仅当
n
n
n是素数。
在以下得小节中,我们应用这个定理到所有得引理中。下面得定理就是一个简单得应用。
引理 4.2 如果
n
n
n是一个素数,以上算法将返回素数。
证明:如果
n
n
n是一个素数,那么步骤1到3将绝不会返回合数。通过引理 2.1,进入到循环中也不能返回合数。因此算法将返回素数在步骤4或者步骤6。
以上引理的反向证明需要花一点功夫。如果算法在步骤4返回素数,那么前3个步骤没有都没有发现 n n n的非平凡因子。因此仅剩一种情况是步骤6。
这个算法拥有两个重要的步骤(2与5):步骤2中寻找一个合适的 r r r而步骤5验证整数 a a a是否符合等式 ( 2 ) (2) (2)。在此之前我们首先要确定 r r r的量级。
步骤2与5是这个算法的一个难点,所以作者帮忙找出了一个很合适 r r r值,
就是引理 4.3提出的理论。
引理 4.312 存在 r ≤ m a x { 3 , ⌈ l o g 5 n ⌉ } r \le max\lbrace3, \lceil log^5n \rceil \rbrace r≤max{3,⌈log5n⌉}则 o r ( n ) > l o g 2 n o_r(n) > log ^2n or(n)>log2n。
证明:当
n
=
2
n=2
n=2,
r
=
3
r=3
r=3时,满足所有条件。当
n
>
2
n>2
n>2时,那么
⌈
l
o
g
5
n
⌉
>
10
\lceil log^5n \rceil > 10
⌈log5n⌉>10 并且根据引理 3.1。观察到对于一个最大的
k
k
k值对于任意
m
k
≤
B
=
⌈
l
o
g
5
n
⌉
m^k \le B = \lceil log^5n \rceil
mk≤B=⌈log5n⌉,
m
≥
2
m \ge 2
m≥2,是
⌊
l
o
g
B
⌋
\lfloor logB \rfloor
⌊logB⌋。现在考虑将不下式整除的最小的
r
r
r
n
⌊
l
o
g
B
⌋
⋅
∏
i
=
1
⌊
l
o
g
2
n
⌋
(
n
i
−
1
)
n^{\lfloor logB \rfloor} \cdot \prod_{i=1}^{\lfloor log^2n \rfloor}(n^i-1)
n⌊logB⌋⋅i=1∏⌊log2n⌋(ni−1)
根据以上的观察
(
r
,
n
)
(r,n)
(r,n)将不能被任何
r
r
r的素因子整除,除非
r
r
r可以被
n
⌊
l
o
g
B
⌋
n^{\lfloor logB \rfloor}
n⌊logB⌋整除。因此
r
(
r
,
n
)
r \over {(r,n)}
(r,n)r也不能被以上结果整除。
r
r
r是最小的不能被上述结果整除的值,由此可见
(
r
,
n
)
=
1
(r,n)=1
(r,n)=1。更进一步的,由于对于每个
1
≤
i
≤
⌊
l
o
g
2
n
⌋
1 \le i \le \lfloor log^2n \rfloor
1≤i≤⌊log2n⌋,
r
r
r都不能被
n
i
−
1
n^i-1
ni−1整除以及
o
r
(
n
)
>
l
o
g
2
n
o_r(n)>log^2n
or(n)>log2n。所以,
n
⌊
l
o
g
B
⌋
⋅
∏
i
=
1
⌊
l
o
g
2
n
⌋
(
n
i
−
1
)
<
n
⌊
l
o
g
B
⌋
+
1
2
l
o
g
2
n
⋅
(
l
o
g
2
n
−
1
)
≤
n
l
o
g
4
n
≤
2
l
o
g
5
n
≤
2
B
n^{\lfloor logB \rfloor} \cdot \prod_{i=1}^{\lfloor log^2n \rfloor}(n^i-1) < n^{{\lfloor logB \rfloor}+\frac{1}{2}log^2n \cdot(log^2n-1)} \le n^{log^4n} \le 2^{log^5n} \le 2^B
n⌊logB⌋⋅i=1∏⌊log2n⌋(ni−1)<n⌊logB⌋+21log2n⋅(log2n−1)≤nlog4n≤2log5n≤2B
(保证第二个不等式的所有的
n
≥
2
n \ge 2
n≥2),根据引理 3.1,数
B
B
B的第一个最小公倍数至少是
2
B
2^B
2B。因此,
r
≤
B
r \le B
r≤B。
由于 o r ( n ) > 1 o_r(n) > 1 or(n)>1,必然存在 n n n的一个素因子 p p p,使得 o r ( p ) > 1 o_r(p)>1 or(p)>1。由于步骤3或者步骤4可以确定 n n n的素性。因此,我们有 p > r p > r p>r。由于 ( n , r ) = 1 (n,r)=1 (n,r)=1(步骤3或者步骤4将确定 n n n的类型), p , n ∈ Z r ∗ p,n \in Z^*_r p,n∈Zr∗。在这节剩余的部分将讨论数 p p p与 r r r的问题。而且,使得 l = ⌊ ϕ ( r ) l o g n ⌋ l = \lfloor \sqrt{\phi(r)}logn \rfloor l=⌊ϕ(r)logn⌋。
步骤5用于验证等式
l
l
l。由于在这个步骤算法不输出合数,所以,我们有:
(
X
+
a
)
n
≡
X
n
+
a
(
m
o
d
X
r
−
1
,
n
)
(X+a)^n \equiv X^n+a \pmod {X^r-1,n}
(X+a)n≡Xn+a(modXr−1,n)
对于每个
a
,
0
≤
a
≤
l
a,0 \le a \le l
a,0≤a≤l(如果
a
=
0
a=0
a=0,那么等式必然成立)。意味着:
(
X
+
a
)
n
≡
X
n
+
a
(
m
o
d
X
r
−
1
,
n
)
(3)
(X+a)^n \equiv X^n+a \pmod {X^r-1,n}\tag{3}
(X+a)n≡Xn+a(modXr−1,n)(3)
对于每个
0
≤
a
≤
l
0 \le a \le l
0≤a≤l,根据引理2.1,我们有:
(
X
+
a
)
p
≡
X
p
+
a
(
m
o
d
X
r
−
1
,
p
)
(4)
(X+a)^p \equiv X^p+a \pmod {X^r-1,p}\tag{4}
(X+a)p≡Xp+a(modXr−1,p)(4)
对于每个
0
≤
a
≤
l
0 \le a \le l
0≤a≤l,根据等式
(
3
)
(3)
(3)与等式
(
4
)
(4)
(4):
(
X
+
a
)
n
p
≡
X
n
p
+
a
(
m
o
d
X
r
−
1
,
p
)
(5)
(X+a)^{\frac{n}{p}} \equiv X^{\frac{n}{p}}+a \pmod {X^r-1,p}\tag{5}
(X+a)pn≡Xpn+a(modXr−1,p)(5)
对于每个
0
≤
a
≤
l
0 \le a \le l
0≤a≤l,在上述等式中,
n
n
n与
n
p
\frac{n}{p}
pn两者的表现都与素数
p
p
p一样。我们给这种属性取个名称:
定义4.4 对于一个多项式
f
(
x
)
f(x)
f(x)与一个数
m
∈
N
m \in \mathscr N
m∈N,我们称
m
m
m是内省的(introspective)对于
f
(
x
)
f(x)
f(x)当:
[
f
(
X
)
]
m
≡
f
(
X
m
)
(
m
o
d
X
r
−
1
,
p
)
[f(X)]^m \equiv f(X^m)\pmod {X^r-1, p}
[f(X)]m≡f(Xm)(modXr−1,p)
当
0
≤
a
≤
l
0 \le a \le l
0≤a≤l对于
X
+
a
X+a
X+a在等式
(
5
)
(5)
(5)与等式
(
4
)
(4)
(4)中
n
p
\frac{n}{p}
pn与
p
p
p是内省的,还是比较清晰的。
下面的引理展示了内省数是符合乘法法则的。
引理4.5 如果
m
m
m与
m
′
m'
m′对于
f
(
X
)
f(X)
f(X)是内省的,那么
m
⋅
m
′
m\cdot m'
m⋅m′也是。
证明:由于
m
m
m对于
f
(
X
)
f(X)
f(X)是内省的,我们有:
[
f
(
X
)
]
m
⋅
m
′
≡
[
f
(
X
m
)
]
m
′
(
m
o
d
X
r
−
1
,
p
)
[f(X)]^{m \cdot m'} \equiv [f(X^m)]^{m'} \pmod {X^r-1,p}
[f(X)]m⋅m′≡[f(Xm)]m′(modXr−1,p)
同样,由于
m
′
m'
m′对于
f
(
X
)
f(X)
f(X)是内省的,我们有(将
X
X
X替换成
X
m
X^m
Xm):
[
f
(
X
m
)
]
m
′
=
f
(
X
m
⋅
m
′
)
(
m
o
d
X
m
⋅
r
−
1
,
p
)
=
f
(
X
m
⋅
m
′
)
(
m
o
d
X
r
−
1
,
p
)
\begin{matrix}[f(X^m)]^{m'} &= f(X^{m \cdot m'}) \pmod {X^{m \cdot r}-1,p}\\ &= f(X^{m \cdot m'}) \pmod {X^r-1,p}\end{matrix}
[f(Xm)]m′=f(Xm⋅m′)(modXm⋅r−1,p)=f(Xm⋅m′)(modXr−1,p)
上式中
X
r
−
1
X^r-1
Xr−1可被
X
m
⋅
r
−
1
X^{m \cdot r}-1
Xm⋅r−1 整除。
合并上面两个等式,我们可以得到:
[
f
(
X
)
]
m
⋅
m
′
≡
f
(
X
m
⋅
m
′
)
(
m
o
d
X
r
−
1
,
p
)
[f(X)]^{m \cdot m'} \equiv f(X^{m \cdot m'}) \pmod {X^r-1,p}
[f(X)]m⋅m′≡f(Xm⋅m′)(modXr−1,p)
所以多项式的内省数
m
m
m是符合乘法原则的。
引理4.6 如果内省数
m
m
m对于每个多项式
f
(
X
)
,
g
(
X
)
f(X),g(X)
f(X),g(X)成立,那么对于它们的积也成立。
证明:
[
f
(
X
)
⋅
g
(
X
)
]
m
=
[
f
(
X
)
]
m
⋅
[
g
(
X
)
]
m
[f(X) \cdot g(X)]^m = [f(X)]^m \cdot [g(X)]^m
[f(X)⋅g(X)]m=[f(X)]m⋅[g(X)]m
[ f ( X ) ] m ⋅ [ g ( X ) ] m = f ( X m ) ⋅ g ( X m ) ( m o d X r − 1 , p ) [f(X)]^m \cdot [g(X)]^m= f(X^m) \cdot g(X^m) \pmod {X^r-1,p} [f(X)]m⋅[g(X)]m=f(Xm)⋅g(Xm)(modXr−1,p)
上述两个引理意味在每个在集合 I = { ( n p ) i ⋅ p j ∣ i , j ≥ 0 } I=\{{(\frac{n}{p})^i \cdot p^j \mid i, j \ge 0}\} I={(pn)i⋅pj∣i,j≥0}中的数对于多项式集合 P = { Π a = 0 l ( X + a ) e a ∣ e a ≥ 0 } P=\{\Pi_{a=0}^l(X+a)^{e_a} \mid e_a \ge 0\} P={Πa=0l(X+a)ea∣ea≥0}都成立。现在我们定义基于以上两个集合的两个群。
第一个群是
I
I
I模
r
r
r的所有剩余类。由于通过观察,
(
n
,
r
)
=
(
p
,
r
)
=
1
(n,r)=(p,r)=1
(n,r)=(p,r)=1,因此它是
Z
r
∗
Z^*_r
Zr∗(模
r
r
r的既约剩余类)的一个子群。设
G
G
G来表示这个群并且
∣
G
∣
=
t
|G| = t
∣G∣=t(表示群
G
G
G的数量)。
G
G
G是通过
n
n
n与
p
p
p模
r
r
r产生的,所以其阶
o
r
>
l
o
g
2
n
o_r \gt log^2n
or>log2n则
t
>
l
o
g
2
n
t \gt log^2n
t>log2n。
为了定义第二个群,我们需要一些关于在有限域上的分圆多项式的基础知识。
使用
Q
r
(
X
)
Q_r(X)
Qr(X)来表示在
F
p
F_p
Fp上的
r
r
r次分圆多项式。多项式
Q
r
(
X
)
Q_r(X)
Qr(X)可以被
X
r
−
1
X^r-1
Xr−1整除并且其因子是阶为
o
r
(
p
)
o_r(p)
or(p)的不可约因子。让
h
(
X
)
h(X)
h(X)表示这样一个不可约因子。由于
o
r
(
p
)
>
1
o_r(p) \gt 1
or(p)>1,所以
h
(
X
)
h(X)
h(X)的阶大于
1
1
1。第二个群是所有在
P
P
P中模
h
(
x
)
h(x)
h(x)与
p
p
p可被消减的多项式。使用
G
\mathscr G
G来表示它。这个群是通过在域
F
=
F
p
[
X
]
/
(
h
(
X
)
)
F=F_p[X]/(h(X))
F=Fp[X]/(h(X))中的多项式
X
,
X
+
1
,
X
+
2
,
…
,
X
+
l
X,X+1,X+2,\ldots,X+l
X,X+1,X+2,…,X+l产生的,并且是群
F
F
F的整数倍的子群。
下面的引理证明了群
G
\mathscr G
G长度的一个下界。
引理4.7(Hendrik Lenstra Jr.)
∣
G
∣
≥
(
t
+
l
t
−
l
)
|\mathscr G| \ge \binom{t+l}{t-l}
∣G∣≥(t−lt+l)
证明:首先要说明的是
h
(
X
)
h(X)
h(X)是分圆多项式
Q
r
(
X
)
Q_r(X)
Qr(X)的一个因子,
X
X
X是在
F
F
F中的
r
r
r次本原单位根。
现在我们的说明的是任意两个在
P
P
P中阶小于
t
t
t的多项式在
G
\mathscr G
G中的映射都有不同的值。让
f
(
X
)
f(X)
f(X)与
g
(
X
)
g(X)
g(X)表示在
P
P
P中的这样两个多项式。假设在域
F
F
F中
f
(
X
)
=
g
(
X
)
f(X)=g(X)
f(X)=g(X),设
m
∈
I
m \in I
m∈I。我们有在域
F
F
F中
[
f
(
X
)
]
m
=
[
g
(
X
)
]
m
[f(X)]^m = [g(X)]^m
[f(X)]m=[g(X)]m。由于
m
m
m是
f
f
f与
g
g
g的内省数,并且
h
(
X
)
h(X)
h(X)可以被
X
r
−
1
X^r-1
Xr−1整除,所以在域
F
F
F中我们得到:
f
(
X
m
)
=
g
(
X
m
)
f(X^m)=g(X^m)
f(Xm)=g(Xm)
这意味着对于每个
m
∈
G
m\in \mathscr G
m∈G,
X
m
X^m
Xm是多项式
Q
(
Y
)
=
f
(
Y
)
−
g
(
Y
)
Q(Y)=f(Y)-g(Y)
Q(Y)=f(Y)−g(Y)的一个根。由于
(
m
,
r
)
=
1
(m,r)=1
(m,r)=1(
G
G
G是
Z
r
∗
Z_r^*
Zr∗的一个子群),每个
X
m
X^m
Xm都是
r
r
r次本原单位根。因此在
F
F
F中当
∣
G
∣
=
t
|G|=t
∣G∣=t时,
Q
(
Y
)
Q(Y)
Q(Y)有相异根。可是通过选择
f
f
f与
g
g
g可以使得
Q
(
Y
)
Q(Y)
Q(Y)的阶小于
t
t
t。这是这与假设矛盾,在
F
F
F中
f
(
X
)
≠
g
(
X
)
f(X) \not = g(X)
f(X)=g(X)。
对于在
F
p
F_p
Fp中的每一个
1
≤
i
≠
j
≤
l
1 \le i \not = j \le l
1≤i=j≤l,其中
l
=
⌊
ϕ
(
r
)
l
o
g
n
⌋
<
r
l
o
g
n
<
r
l=\lfloor \sqrt{\phi(r)}logn \rfloor \lt \sqrt{r}logn \lt r
l=⌊ϕ(r)logn⌋<rlogn<r并且
p
>
r
p \gt r
p>r。因此在
F
F
F中
X
,
X
+
1
,
X
+
2
,
…
,
X
+
l
X,X+1,X+2,\ldots,X+l
X,X+1,X+2,…,X+l两两相异。又因为
h
h
h的阶大于
1
1
1,在
F
F
F中对于每个
a
a
a(
0
≤
a
≤
l
0 \le a \le l
0≤a≤l),
X
+
a
≠
0
X+a \not = 0
X+a=0。因此在
G
\mathscr G
G中至少存在
l
+
1
l+1
l+1个不同的一阶多项式,因此在
G
G
G中至少存在
(
t
+
l
t
−
l
)
\binom{t+l}{t-l}
(t−lt+l)个相异的阶
<
t
\lt t
<t的多项式。
在这种情况下,
n
n
n不是
p
p
p的纯幂次形式,而
G
G
G的长度的一个上界也可以确定:
引理4.8 如果
n
n
n不是
p
p
p的纯幂次形式,那么
∣
G
∣
≤
n
t
|G| \le n^{\sqrt{t}}
∣G∣≤nt
证明,考虑以下
I
I
I的子集:
I
^
=
{
(
n
p
)
i
⋅
p
j
∣
0
≤
i
,
j
≤
⌊
t
⌋
}
\hat I = \{(\frac{n}{p})^i \cdot p^j \mid 0 \le i, j \le \lfloor \sqrt{t} \rfloor\}
I^={(pn)i⋅pj∣0≤i,j≤⌊t⌋}
如果
n
n
n不是
p
p
p的纯幂次形式,那么集合
I
^
\hat I
I^有
(
⌊
t
⌋
+
1
)
2
>
t
(\lfloor \sqrt{t} \rfloor + 1) ^ 2 \gt t
(⌊t⌋+1)2>t
个,其中每个元素两两相异。由于
∣
G
∣
=
t
|G|=t
∣G∣=t,其中至少两个在
I
^
\hat I
I^中的数模
r
r
r同余。设
m
1
>
m
2
m_1 \gt m_2
m1>m2。因此我们有:
X
m
1
≡
X
m
2
(
m
o
d
X
r
−
1
)
X^{m_1} \equiv X^{m_2} \pmod {X^r -1}
Xm1≡Xm2(modXr−1)
设
f
(
X
)
∈
P
f(X) \in P
f(X)∈P,那么
[
f
(
X
)
]
m
1
=
f
(
X
m
1
(
m
o
d
X
r
−
1
,
p
)
[f(X)]^{m_1} = f(X^{m_1} \pmod{X^r-1,p}
[f(X)]m1=f(Xm1(modXr−1,p)
f
(
X
m
1
(
m
o
d
X
r
−
1
,
p
)
=
f
(
X
m
2
(
m
o
d
X
r
−
1
,
p
)
f(X^{m_1} \pmod{X^r-1,p} = f(X^{m_2} \pmod{X^r-1,p}
f(Xm1(modXr−1,p)=f(Xm2(modXr−1,p)
f
(
X
m
2
(
m
o
d
X
r
−
1
,
p
)
=
[
f
(
X
)
]
m
2
(
m
o
d
X
r
−
1
,
p
)
f(X^{m_2} \pmod{X^r-1,p} = [f(X)]^{m_2} \pmod{X^r-1,p}
f(Xm2(modXr−1,p)=[f(X)]m2(modXr−1,p)
所以在域
F
F
F中
[
f
(
X
)
]
m
1
=
[
f
(
X
)
]
m
2
[f(X)]^{m_1} = [f(X)]^{m_2}
[f(X)]m1=[f(X)]m2
因此
f
(
X
)
∈
G
f(X) \in \mathscr G
f(X)∈G是多项式
Q
′
(
Y
)
=
Y
m
1
−
Y
m
2
Q'(Y) = Y^{m_1} - Y^{m_2}
Q′(Y)=Ym1−Ym2在域
F
F
F中的一个根。
f
(
X
)
f(X)
f(X)是
G
\mathscr G
G中的任意元素,因此在
F
F
F中多项式
Q
′
(
Y
)
Q'(Y)
Q′(Y)至少有
∣
G
∣
|\mathscr G|
∣G∣个两两相异的根。
Q
′
(
Y
)
Q'(Y)
Q′(Y)的阶是
m
1
≤
(
n
p
⋅
p
)
⌊
t
⌋
≤
n
t
m_1 \le (\frac{n}{p}\cdot p)^{\lfloor \sqrt{t} \rfloor} \le n^{\sqrt{t}}
m1≤(pn⋅p)⌊t⌋≤nt。这说明
∣
G
∣
≤
n
t
|\mathscr G| \le n^{\sqrt{t}}
∣G∣≤nt。
通过预估出来的
∣
G
∣
|\mathscr G|
∣G∣的规模,我们现在证明算法的正确性:
引理4.9 如果算法返回素数,那么
n
n
n是素数。
证明,假设算法返回素数,根据引理4.7意味着对于
t
=
∣
G
∣
t=|G|
t=∣G∣与
l
=
⌊
ϕ
(
r
)
l
o
g
n
⌋
l=\lfloor \sqrt{\phi(r)}logn \rfloor
l=⌊ϕ(r)logn⌋:
∣
G
∣
≥
(
t
+
l
t
−
l
)
≥
(
l
+
1
+
⌊
t
l
o
g
n
⌋
⌊
t
l
o
g
n
⌋
)
(
t
>
t
l
o
g
n
)
≥
(
2
⌊
t
l
o
g
n
⌋
+
1
⌊
t
l
o
g
n
⌋
)
(
l
=
⌊
ϕ
(
r
)
l
o
g
n
⌋
≥
⌊
t
l
o
g
n
⌋
)
>
2
⌊
t
l
o
g
n
⌋
+
1
(
⌊
t
l
o
g
n
⌋
>
⌊
l
o
g
2
n
⌋
≥
1
)
≥
n
t
\begin{matrix}|\mathscr G| &\ge \binom{t+l}{t-l}\\ &\ge \binom{l+1+\lfloor \sqrt{t}logn \rfloor}{\lfloor \sqrt{t}logn \rfloor}(t \gt \sqrt{t}logn)\\ &\ge \binom{2\lfloor \sqrt{t}logn \rfloor+1}{\lfloor \sqrt{t}logn \rfloor}(l=\lfloor \sqrt{\phi(r)}logn \rfloor \ge \lfloor \sqrt{t}logn \rfloor)\\ &\gt 2^{\lfloor \sqrt{t}logn \rfloor+1}(\lfloor \sqrt{t}logn \rfloor \gt \lfloor log^2n \rfloor \ge 1)\\ &\ge n^{\sqrt{t}} \end{matrix}
∣G∣≥(t−lt+l)≥(⌊tlogn⌋l+1+⌊tlogn⌋)(t>tlogn)≥(⌊tlogn⌋2⌊tlogn⌋+1)(l=⌊ϕ(r)logn⌋≥⌊tlogn⌋)>2⌊tlogn⌋+1(⌊tlogn⌋>⌊log2n⌋≥1)≥nt
根据引理4.8,如果
n
n
n不是
p
p
p的纯幂次形式,那么
∣
G
∣
≤
n
t
|\mathscr G| \le n^{\sqrt{t}}
∣G∣≤nt。因此对于一些
k
>
0
k \gt 0
k>0,
n
=
p
k
n=p^k
n=pk。如果
k
>
1
k \gt 1
k>1那么算法将在第一步返回合数。因此,
n
=
p
n=p
n=p。
以上就是整个算法的完整证明。
到这里为止就是AKS的原理部分,后边的部分是效率分析与未来改进的地方,没兴趣的可以不做了解了。这里我们稍微做下总结,并且按照程序员的角度一步步的分析并给出_Python_语言的实现。
#!/usr/bin/python
# coding:utf-8
#import numpy as np
import math
import ysym
from ysym.ypolynomial import *
import gmpy2
def is_prime_by_AKS(n):
"""
使用AKS算法确定n是否是一个素数
True:n是素数
False:n是合数
"""
def __is_integer__(n):
"""
判断一个数是否是整数
"""
i = int(n)
f = n - i
return not f
def __phi__(n):
"""
欧拉函数,测试小于n并与n互素的个数
"""
res = n
a = n
for i in range(2, a+1):
if a % i == 0:
res = res // i * (i - 1)
while a % i == 0:
a //= i
if a > 1:
res = res // a * (a - 1)
return res
def __gcd__(a, b):
"""
计算a b的最大公约数
"""
if b == 0:
return a
return __gcd__(b, a % b)
print("步骤1, 确定%d是否是纯次幂" % n)
for b in range(2, math.floor(math.log2(n))+1):
a = n**(1/b)
if __is_integer__(a):
return False
print("步骤2,找到一个最小的r,符合o_r(%d) > (log%d)^2" % (n, n))
maxk = math.floor(math.log2(n)**2)
maxr = max(3, math.ceil(math.log2(n)**5))
nextR = True
r = 0
for r in range(2, maxr):
if nextR == False:
break
nextR = False
for k in range(1, maxk+1):
if nextR == True:
break
nextR = (gmpy2.mpz(n**k % r) == 0) or (gmpy2.mpz(n**k % r) == 1)
r = r - 1 # 循环多增加了一层
print("r = %d" % r)
print("步骤3,如果 1 < gcd(a, %d) < %d,对于一些 a <= %d, 输出合数" % (n, n, r))
for a in range(r, 1, -1):
g = __gcd__(a, n)
if g > 1 and g < n:
return False
print("步骤4,如果n=%d <= r=%d,输出素数" % (n, r))
if n <= r:
return True
print("步骤5")
print("遍历a从1到\sqrt{\phi(r=%d)}logn=%d" % (r, n))
print("如果(X+a)^%d != X^%d+a mod {X^%d-1, %d}$输出合数" % (n, n, r, n))
# 构造P = (X+a)^n mod (X^r-1)
print("构造多项式(X+a)^%d,并且进行二项式展开" % n)
X = multi_ysymbols('X')
a = multi_ysymbols('a')
X_a_n_expand = binomial_expand(ypolynomial1(X, a), n)
print(X_a_n_expand)
X.pow(r)
reduce_poly = ypolynomial1(X, ysymbol(value=-1.0))
print("构造消减多项式 %s" % reduce_poly)
print("进行运算 (X+a)^%d mod (X^%d-1)" % (n, r))
r_equ = ypolynomial_mod(X_a_n_expand, reduce_poly)
print("得到余式: %s" % r_equ)
print("进行运算'余式' mod %d 得到式(A)" % n)
A = ypolynomial_reduce(r_equ, n)
print("A = %s" % A)
print("B = x^%d+a mod x^%d-1" % (n, r))
B = ypolynomial1(multi_ysymbols('X', power=31), a)
B = ypolynomial_mod(B, reduce_poly)
print("B = %s" % B)
C = ypolynomial_sub(A, B)
print("C = A - B = %s" % C)
maxa = math.floor(math.sqrt(__phi__(r)) * math.log2(n))
print("遍历a = 1 to %d" % maxa)
print("检查每个'%s = 0 (mod %d)'" % (C, n))
for a in range(1, maxa+1):
print("检查a = %d" % a)
C.set_variables_value(a=a)
v = C.eval()
if v % n != 0:
return False
print("步骤6 输出素数")
return True
if __name__ == "__main__":
n = 31
print("检查'%d'是否为素数" % n)
result = is_prime_by_AKS(n)
if result is True:
print("YES")
else:
print("NO")
else:
pass
5.时间复杂性分析与优化
这里先列出在 Z n Z_n Zn上运算的复杂度以备参考
以下的算法复杂度分析是直接给出的,这种计算是基于 m m m比特位的数进行加减乘除运算是在 O ∼ ( m ) O\sim(m) O∼(m)时间内的。简单得讲,在两个系数最多 m m m比特位的 d d d阶多项式上进行以上运行能在 O ∼ ( d ⋅ m ) O\sim(d\cdot m) O∼(d⋅m)步能完成。
引理 5.1 这个算法的渐进时间为
O
∼
(
l
o
g
21
/
2
n
)
O\sim(log^{21/2}n)
O∼(log21/2n)。
证明,算法的步骤1花费大约
O
∼
(
l
o
g
3
n
)
O\sim(log^3n)
O∼(log3n)
算法的步骤2,我们要找到一个满足
o
r
(
n
)
>
l
o
g
2
n
o_r(n) \gt log^2n
or(n)>log2n的
r
r
r。这需要遍历测试每个
r
r
r(
n
k
≢
1
(
m
o
d
r
)
n^k \not \equiv 1 \pmod{r}
nk≡1(modr),其中
k
≤
l
o
g
2
n
k \le log^2n
k≤log2n)。对于一个特殊的
r
r
r,模
r
r
r的乘法最多花费
O
(
l
o
g
2
n
)
O(log^2n)
O(log2n)因此这将花费
O
∼
(
l
o
g
2
n
l
o
g
r
)
O\sim(log^2nlogr)
O∼(log2nlogr)。根据引理 4.3我们仅需要尝试
O
(
l
o
g
5
n
)
O(log^5n)
O(log5n)次不同的
r
r
r。因此步骤2总共需要花费
O
∼
(
l
o
g
7
n
)
O\sim(log^7n)
O∼(log7n)。
第三个步骤计算
r
r
r个数的_gcd_。每个_gcd_需要花费
O
(
l
o
g
n
)
O(logn)
O(logn),所以步骤3总共花费的
O
(
r
l
o
g
n
)
=
O
(
l
o
g
6
n
)
O(rlogn) = O(log^6n)
O(rlogn)=O(log6n)。步骤4仅需要花费
O
(
l
o
g
n
)
O(logn)
O(logn)。
在步骤5中,我们需要验证
⌊
ϕ
(
r
)
l
o
g
n
⌋
\lfloor \sqrt{\phi(r)}logn \rfloor
⌊ϕ(r)logn⌋个等式。每个等式需要花费
O
(
l
o
g
n
)
O(logn)
O(logn)倍的系数的长度为
O
(
l
o
g
n
)
O(logn)
O(logn)的
d
d
d阶多项式时间。因此每个等式能被在
O
∼
(
r
l
o
g
2
n
)
O\sim(rlog^2n)
O∼(rlog2n)个时间步内被验证。因此步骤5的时间复杂度是
O
∼
(
r
ϕ
(
r
)
l
o
g
3
n
)
=
O
∼
(
r
3
2
l
o
g
3
n
)
=
O
∼
(
l
o
g
21
/
2
n
O\sim(r\sqrt{\phi(r)}log^3n)=O\sim(r^{\frac{3}{2}}log^3n)=O\sim(log^{21/2}n
O∼(rϕ(r)log3n)=O∼(r23log3n)=O∼(log21/2n。因此这个步骤占整个算法花费的绝大部分时间。
这个算法性能提高的关键字在于对
r
r
r的估计(引理 4.3)。当然最好的情况是当
r
=
O
(
l
o
g
2
n
)
r=O(log^2n)
r=O(log2n)并且算法的复杂度在
O
∼
(
l
o
g
6
n
)
O\sim(log^6n)
O∼(log6n)。事实上,有两个猜想猜测这样一个
r
r
r。
Artin猜想:给定任意数非完全平方的 n ∈ N n\in \mathscr N n∈N,那么素数的数量 q ≤ m q \le m q≤m对于 o q ( n ) = q − 1 o_q(n) = q-1 oq(n)=q−1是逐渐趋向于 A ( n ) ⋅ m l n m A(n)\cdot \frac{m}{lnm} A(n)⋅lnmm,这里 A ( n ) A(n) A(n)是Artin常数, A ( n ) > 0.35 A(n) \gt 0.35 A(n)>0.35。
Sophie-Germain素数分布猜想:对于素数个数 q q q小于等于 m m m,那么 2 q + 1 2q+1 2q+1仍然是一个素数并且渐进于 2 C 2 m l n 2 m \frac{2C_2m}{ln^2m} ln2m2C2m,这里 C 2 C_2 C2是孪生素数常量(估计接近 0.66 0.66 0.66)。具有这种属性的素数被称为Sophie-Germain素数。
Artin猜想-当
r
=
O
(
l
o
g
2
n
)
r=O(log^2n)
r=O(log2n)时对于
m
=
O
∼
(
l
o
g
2
n
)
m = O\sim(log^2n)
m=O∼(log2n)有效。在对Artin猜想的证明已经取得了一些进展[GM84,GMM85,HB86],这个猜想在一定条件的广义黎曼假设下成立是被承认的。
如果第二个猜想成立,我们应当断定
r
=
O
∼
(
l
o
g
2
n
)
r = O\sim(log^2n)
r=O∼(log2n):
根据Sophie-Germain素数分布,至少存在
l
o
g
2
n
log^2n
log2n个素数在
8
l
o
g
2
n
8log^2n
8log2n与
c
l
o
g
2
n
(
l
o
g
l
o
g
n
)
2
clog^2n(loglogn)^2
clog2n(loglogn)2之间,其中
c
c
c是一个合适的常数。对于这样一个素数
q
q
q,
o
q
(
n
)
≤
2
o_q(n) \le 2
oq(n)≤2或者
o
q
(
n
)
≥
q
−
1
2
o_q(n) \ge \frac{q-1}{2}
oq(n)≥2q−1。任意
q
q
q对于每个
o
q
(
n
)
≤
2
o_q(n) \le 2
oq(n)≤2都被
n
2
−
1
n^2-1
n2−1整除,因此像这样的素数
q
q
q的数量上界是
O
(
l
o
g
n
)
O(logn)
O(logn)。这意味着必然存在一个素数
r
=
O
∼
(
l
o
g
2
n
)
r=O\sim(log^2n)
r=O∼(log2n)以致
o
r
(
n
)
>
l
o
g
2
n
o_r(n) \gt log^2n
or(n)>log2n。这样的一个
r
r
r将花费
O
∼
(
l
o
g
6
n
)
O\sim(log^6n)
O∼(log6n)的时间复杂度。
对于这个猜想也取得了一些进展。设
P
(
m
)
P(m)
P(m)表示
m
m
m的最大素因子。[Gol69]说明了
P
(
q
−
1
)
>
q
1
2
+
c
P(q-1) \gt q^{\frac{1}{2}+c}
P(q−1)>q21+c,其中
q
q
q是素数并且
c
≈
1
12
c\approx\frac{1}{12}
c≈121,同时具有正的密度。对于这个理论的进一步提高,_Fouvry_做了以下工作:
引理 5.2[Fou85] 存在常熟
c
>
0
c \gt 0
c>0与
n
0
n_0
n0,对于所有的
x
≥
n
0
x \ge n_0
x≥n0:
∣
{
q
∣
q
是
素
数
,
q
≤
x
,
P
(
q
−
1
)
>
q
2
3
}
∣
≥
c
x
l
n
x
|\{q \mid q是素数,q \le x, P(q-1) \gt q^{\frac{2}{3}}\}| \ge c\frac{x}{lnx}
∣{q∣q是素数,q≤x,P(q−1)>q32}∣≥clnxx
以上引理当指数大于
0.6683
0.6683
0.6683时被证实[BH96]。使用以上引理我们可以提高我们的算法性能。
引理 5.3 这个算法的时间复杂度为
O
∼
(
l
o
g
15
/
2
n
)
O\sim(log^{15/2}n)
O∼(log15/2n)
证明,通过以上的讨论,一个高密度的素数分布
P
(
q
−
1
)
>
q
2
3
P(q-1) \gt q^{\frac{2}{3}}
P(q−1)>q32(
q
q
q是素数)意味着步骤2可以找到一个
r
=
O
(
l
o
g
3
n
)
r=O(log^3n)
r=O(log3n),其中
o
r
(
n
)
>
l
o
g
2
n
o_r(n) \gt log^2n
or(n)>log2n。这将把这个算法的复杂度降低到
O
∼
(
l
o
g
15
/
2
n
)
O\sim(log^{15/2}n)
O∼(log15/2n)。
最近,Hendrik Lenstra_与_Carl Pomerance[LP03]提出了这个算法的修改版本并证明了算法的复杂度在
O
∼
(
l
o
g
6
n
)
O\sim(log^6n)
O∼(log6n)。
6.未来要做的事情
在我们的算法中,步骤5的循环需要运行
⌊
ϕ
r
l
o
g
n
⌋
\lfloor \sqrt{\phi{r}}logn \rfloor
⌊ϕrlogn⌋次确保群
G
\mathscr G
G的规模足够大。如果我们可以找到一个比集合
(
X
+
a
)
(X+a)
(X+a)产生的群更小的规模则这个迭代的次数可以被减少。
如果[BP01]提出的猜想被验证并且在
r
≤
100
,
n
≤
1
0
1
0
r \le 100,n \le 10^10
r≤100,n≤1010范围内[KS02]被证实,则我们的算法复杂度可以在
O
∼
(
l
o
g
3
n
)
O\sim(log^3n)
O∼(log3n)。
猜想 如果
r
r
r是一个不能整除
n
n
n的素数,并且如果
(
X
−
1
)
n
≡
X
n
−
1
(
m
o
d
X
r
−
1
,
n
)
(6)
(X-1)^n \equiv X^n-1 \pmod{X^r-1,n} \tag{6}
(X−1)n≡Xn−1(modXr−1,n)(6)
那么
n
n
n是素数或者
n
2
≡
1
(
m
o
d
r
)
n^2 \equiv 1\pmod{r}
n2≡1(modr)。
如果这个猜想是正确的,我们可以修改我们的算法首先寻找一个不能整除
n
2
−
1
n^2-1
n2−1的数
r
r
r。以致
r
r
r能在范围
[
2
,
4
l
o
g
n
]
[2,4logn]
[2,4logn]内。这是因为素数的积小于
x
x
x并且至少是
e
x
e^x
ex([Apo97])。然后我们可以测试全等式
(
6
)
(6)
(6)成立或者不成立。验证这个全等式需要花费
O
∼
(
r
l
o
g
2
n
)
O\sim(rlog^2n)
O∼(rlog2n)。这将有
O
∼
(
l
o
g
3
n
)
O\sim(log^3n)
O∼(log3n)的时间复杂度。
近期,Hendrik Lenstra_与_Carl Pomerance[LP03b]提出一些参数表明以上猜想是错误的。但是,对于一些变量这个猜想仍然是正确的(例如,如果我们强行指定
r
>
l
o
g
n
r \gt logn
r>logn)
感谢
作者感谢的一些话,这里就不翻译了。
参考资料
[AB03] M. Agrawal and S. Biswas. Primality and identity testing via Chinese remaindering. Jl. of the ACM, 50:429–443, 2003.
[AH92] L. M. Adleman and M.-D. Huang. Primality testing and two dimensional Abelian varieties over finite fields. Lecture Notes in Mathematics, 1512, 1992.
[AKS03] Manindra Agrawal, Neeraj Kayal, and Nitin Saxena. PRIMES is in P. Preprint
(http://www.cse.iitk.ac.in/news/primality v3.ps), February 2003.
[Apo97] T. M. Apostol. Introduction to Analytic Number Theory. Springer-Verlag, 1997.
[APR83] L. M. Adleman, C. Pomerance, and R. S. Rumely. On distinguishing prime numbers from
composite numbers. Ann. Math., 117:173–206, 1983.
[Atk86] A. O. L. Atkin. Lecture notes of a conference, boulder (colorado). Manuscript, August 1986.
[BH96] R. C. Baker and G. Harman. The Brun-Titchmarsh Theorem on average. In Proceedings of a conference in Honor of Heini Halberstam, Volume 1, pages 39–103, 1996.
[BP01] Rajat Bhattacharjee and Prashant Pandey. Primality testing. Technical report, IIT Kanpur,
2001. Available at http://www.cse.iitk.ac.in/research/btp2001/primality.html.
[Car10] R. D. Carmichael. Note on a number theory function. Bull. Amer. Math. Soc., 16:232–238,
1910.
[Fou85] E. Fouvry. Theoreme de Brun-Titchmarsh; application au theoreme de Fermat. Invent. Math.,
79:383–407, 1985.
[GK86] S. Goldwasser and J Kilian. Almost all primes can be quickly certified. In Proceedings of
Annual ACM Symposium on the Theory of Computing, pages 316–329, 1986.
[GM84] R. Gupta and M. Ram Murty. A remark on Artin’s conjecture. Inventiones Math., 78:127–130,
1984.
[GMM85] R. Gupta, V. Kumar Murty, and M. Ram Murty. The Euclidian algorithm for S integers. In
CMS Conference Proceedings, pages 189–202, 1985.
[Gol69] M. Goldfeld. On the number of primes p for which p+a has a large prime factor. Mathematika,
16:23–27, 1969.
[HB86] D. R. Heath-Brown. Artin’s conjecture for primitive roots. Quart. J. Math. Oxford, (2) 37:27–
38, 1986.
[KS02] Neeraj Kayal and Nitin Saxena. Towards a deterministic polynomialtime test. Technical report, IIT Kanpur, 2002. Available at
http://www.cse.iitk.ac.in/research/btp2002/primality.html.
[KSS02] Adam Kalai, Amit Sahai, and Madhu Sudan. Notes on primality test and analysis of AKS.
Private communication, August 2002.
[Lee90] J. V. Leeuwen, editor. Handbook of Theoretical Computer Science, Volume A. Elsevier, 1990.
[Len02] H. W. Lenstra, Jr. Primality testing with cyclotomic rings. Unpublished
(http://cr.yp.to/papers.html#aks has an exposition of Lenstra’s argument), August 2002.
[LN86] R. Lidl and H. Niederreiter. Introduction to finite fields and their applications. Cambridge
University Press, 1986.
[LP03a] H. W. Lenstra, Jr. and Carl Pomerance. Primality testing with gaussian periods. Private
communication, March 2003.
[LP03b] H. W. Lenstra, Jr. and Carl Pomerance. Remarks on Agrawal’s conjecture. Unpublished
(http://www.aimath.org/WWN/primesinp/articles/html/50a/), March 2003.
[Mac02] Martin Macaj. Some remarks and questions about the AKS algorithm and related conjecture.
Unpublished (http://thales.doa.fmph.uniba.sk/macaj/aksremarks.pdf), December 2002.
[Mil76] G. L. Miller. Riemann’s hypothesis and tests for primality. J. Comput. Sys. Sci., 13:300–317,
1976.
[Nai82] M. Nair. On Chebyshev-type inequalities for primes. Amer. Math. Monthly, 89:126–129, 1982.
[Pra75] V. Pratt. Every prime has a succinct certificate. SIAM Journal on Computing, 4:214–220,
1975.
[Rab80] M. O. Rabin. Probabilistic algorithm for testing primality. J. Number Theory, 12:128–138,
1980.
[SS77] R. Solovay and V. Strassen. A fast Monte-Carlo test for primality. SIAM Journal on Computing, 6:84–86, 1977.
[vzGG99] Joachim von zur Gathen and J¨urgen Gerhard. Modern Computer Algebra. Cambridge University Press, 1999
埃拉托色尼(公元前三世纪的希腊天文学家、数学家和地理学家) ↩︎
https://en.wikipedia.org/wiki/Fermat%27s_little_theorem ↩︎
https://en.wikipedia.org/wiki/Carmichael_number ↩︎
https://en.wikipedia.org/wiki/Complexity_theory ↩︎
https://en.wikipedia.org/wiki/Co-NP ↩︎
https://en.wikipedia.org/wiki/Generalized_Riemann_hypothesis ↩︎
https://en.wikipedia.org/wiki/Jacobi_symbol ↩︎
https://en.wikipedia.org/wiki/Elliptic_curve ↩︎
https://en.wikipedia.org/wiki/Sophie_Germain_prime ↩︎
https://en.wikipedia.org/wiki/Ring_(mathematics) ↩︎
https://en.wikipedia.org/wiki/Field_(mathematics) ↩︎
例如, r ≤ ⌈ l o g 5 n ⌉ r \le \lceil log^5n \rceil r≤⌈log5n⌉,相应的当 n ≤ 5 , 690 , 034 n \le 5,690,034 n≤5,690,034时满足步骤4。 ↩︎