WV.29-大数阶乘算法9-求N!的高精度算法

求N!的高精度算法

 

本文是张一飞2001年写的论文,原文可从http://oibh.kuye.cn/download/thesis/thesis2001_zhangyifei.zip处下载

 求N!的高精度算法

本文中的算法主要针对Pascal语言

这篇文章的内容

你了解高精度吗?

你曾经使用过哪些数据结构?

你仔细思考过如何优化算法吗?

在这里,你将看到怎样成倍提速求N!的高精度算法


Pascal中的标准整数类型

数据类型

值域

Shortint

-128~127

Byte

0 ~ 255

Integer

-32768 ~ 32768

Word

0 ~ 65535

LongInt

-2147483648~2147483647

Comp

-9.2e18~9.2e18

Comp虽然属于实型,实际上是一个64位的整数

高精度算法的基本思想

Pascal中的标准整数类型最多只能处理在-263~263之间的整数。如果要支持更大的整数运算,就需要使用高精度

高精度算法的基本思想,就是将无法直接处理的大整数,分割成若干可以直接处理的小整数段,把对大整数的处理转化为对这些小整数段的处理


数据结构的选择

每个小整数段保留尽量多的位

使用Comp类型

采用二进制表示法


每个小整数段保留尽量多的位

一个例子:计算两个15位数的和

Ø方法一

•分为15个小整数段,每段都是1位数,需要15次1位数加法

Ø方法二

•分为5个小整数段,每段都是3位数,需要5次3位数加法

Ø方法三

•Comp类型可以直接处理15位的整数,故1次加法就可以了

Ø比较

•用Integer计算1位数的加法和3位数的加法是一样快的

•故方法二比方法一效率高

•虽然对Comp的操作要比Integer慢,但加法次数却大大减少

•实践证明,方法三比方法二更快


使用Comp类型

高精度运算中,每个小整数段可以用Comp类型表示

Comp有效数位为19~20位

求两个高精度数的和,每个整数段可以保留17位

求高精度数与不超过m位整数的积,每个整数段可以保留18–m位

求两个高精度数的积,每个整数段可以保留9位

如果每个小整数段保留k位十进制数,实际上可以认为其只保存了1位10k进制数,简称为高进制数,称1位高进制数为单精度数


采用二进制表示法

采用二进制表示,运算过程中时空效率都会有所提高,但题目一般需要以十进制输出结果,所以还要一个很耗时的进制转换过程。因此这种方法竞赛中一般不采用,也不在本文讨论之列.


算法的优化

高精度乘法的复杂度分析

连乘的复杂度分析

设置缓存

分解质因数求阶乘

二分法求乘幂

分解质因数后的调整


高精度乘法的复杂度分析

计算n位高进制数与m位高进制数的积

Ø需要n*m次乘法

Ø积可能是n+m–1或n+m位高进制数


连乘的复杂度分析(1)

一个例子:计算5*6*7*8

Ø方法一:顺序连乘

•5*6=30,1*1=1次乘法

•30*7=210,2*1=2次乘法

•210*8=1680,3*1=3次乘法  共6次乘法

Ø方法二:非顺序连乘

•5*6=30,1*1=1次乘法

•7*8=56,1*1= 1次乘法

•30*56=1680,2*2=4次乘法   共6次乘法


连乘的复杂度分析(2)

若“n位数*m位数=n+m位数”,则n个单精度数,无论以何种顺序相乘,乘法次数一定为n(n-1)/2次

Ø证明:

•设F(n)表示乘法次数,则F(1)=0,满足题设

•设k<n时,F(k)=k(k-1)/2,现在计算F(n)

•设最后一次乘法计算为“k位数*(n-k)位数”,则

•F(n)=F(k)+F(n-k)+k (n-k)=n(n-1)/2(与k的选择无关)


设置缓存(1)

一个例子:计算9*8*3*2

Ø方法一:顺序连乘

•9*8=72,1*1=1次乘法

•72*3=216,2*1=2次乘法

•216*2=432,3*1=3次乘法

Ø方法二:非顺序连乘

•9*8=72,1*1=1次乘法

•3*2=6,1*1=1次乘法

•72*6=432,2*1=2次乘法

共6次乘法

 


特点:n位数*m位数可能是n+m-1位数


设置缓存(2)

考虑k+t个单精度数相乘a1*a2*…*ak*ak+1*…*ak+t

Ø设a1*a2*…*ak结果为m位高进制数(假设已经算出)

Øak+1*…*ak+t结果为1位高进制数

Ø若顺序相乘,需要t次“m位数*1位数”,共mt次乘法

Ø可以先计算ak+1*…*ak+t,再一起乘,只需要m+t次乘法

在设置了缓存的前提下,计算m个单精度数的积,如果结果为n位数,则乘法次数约为n(n–1)/2次,与m关系不大 

–设S=a1a2… am,S是n位高进制数
–可以把乘法的过程近似看做,先将这m个数分为n组,每组的积仍然是一个单精度数,最后计算后面这n个数的积。时间主要集中在求最后n个数的积上,这时基本上满足“n位数*m位数=n+m位数”,故乘法次数可近似的看做n(n-1)/2次 


设置缓存(3)

缓存的大小

Ø设所选标准数据类型最大可以直接处理t位十进制数

Ø设缓存为k位十进制数,每个小整数段保存t–k位十进制数

Ø设最后结果为n位十进制数,则乘法次数约为

Øk/(n–k) ∑(i=1..n/k)i=(n+k)n/(2k(t–k)),其中k远小于n

Ø要乘法次数最少,只需k (t–k)最大,这时k=t/2

Ø因此,缓存的大小与每个小整数段大小一样时,效率最高

Ø故在一般的连乘运算中,可以用Comp作为基本整数类型,每个小整数段为9位十进制数,缓存也是9位十进制数


分解质因数求阶乘

例:10!=28*34*52*7

Øn!分解质因数的复杂度远小于nlogn,可以忽略不计

Ø与普通算法相比,分解质因数后,虽然因子个数m变多了,但结果的位数n没有变,只要使用了缓存,乘法次数还是约为n(n-1)/2次

Ø因此,分解质因数不会变慢(这也可以通过实践来说明)

Ø分解质因数之后,出现了大量求乘幂的运算,我们可以优化求乘幂的算法。这样,分解质因数的好处就体现出来了


二分法求乘幂

二分法求乘幂,即:

Øa2n+1=a2n*a

Øa2n=(an)2

Ø其中,a是单精度数

复杂度分析

Ø假定n位数与m位数的积是n+m位数

Ø设用二分法计算an需要F(n)次乘法

ØF(2n)=F(n)+n2,F(1)=0

Ø设n=2k,则有F(n)=F(2k)=∑(i=0..k–1)4i=(4k–1)/3=(n2–1)/3

与连乘的比较

Ø用连乘需要n(n-1)/2次乘法,二分法需要(n2–1)/3

Ø连乘比二分法耗时仅多50%

Ø采用二分法,复杂度没有从n2降到nlogn


二分法求乘幂之优化平方算法

怎样优化

Ø(a+b)2=a2+2ab+b2

Ø例:123452=1232*10000+452+2*123*45*100

Ø把一个n位数分为一个t位数和一个n-t位数,再求平方

怎样分

Ø设求n位数的平方需要F(n)次乘法

ØF(n)=F(t)+F(n-t)+t(n-t),F(1)=1

Ø用数学归纳法,可证明F(n)恒等于n(n+1)/2

Ø所以,无论怎样分,效率都是一样

Ø将n位数分为一个1位数和n–1位数,这样处理比较方便


二分法求乘幂之复杂度分析

复杂度分析

Ø前面已经求出F(n)=n(n+1)/2,下面换一个角度来处理

ØS2=(∑(0i<n)ai10i)2=∑(0i<n)ai2102i+2∑(0i<j<n)aiaj10i+j

Ø一共做了n+C(n,2)=n(n+1)/2次乘法运算

Ø普通算法需要n2次乘法,比改进后的慢1倍

改进求乘幂的算法

Ø如果在用改进后的方法求平方,则用二分法求乘幂,需要(n+4)(n–1)/6次乘法,约是连乘算法n(n–1)/2的三分之一


分解质因数后的调整(1)

为什么要调整

Ø计算S=211310,可以先算211,再算310,最后求它们的积

Ø也可以根据S=211310=610*2,先算610,再乘以 2即可

Ø两种算法的效率是不同的


分解质因数后的调整(2)

什么时候调整

Ø计算S=ax+kbx=(ab)xak

Ø当k<xlogab时,采用(ab)xak比较好,否则采用ax+kbx更快

Ø证明:

•可以先计算两种算法的乘法次数,再解不等式,就可以得到结论

•也可以换一个角度来分析。其实,两种算法主要差别在最后一步求积上。由于两种方法,积的位数都是一样的,所以两个因数的差越大,乘法次数就越小

•∴当axbx–ak>ax+k–bx时,选用(ab)xak,反之,则采用ax+kbx

•∴axbx–ak>ax+k–bx

•∴(bx–ak)(ax+1)>0

•∴bx>ak

•这时k<xlogab


总结

内容小结

Ø用Comp作为每个小整数段的基本整数类型

Ø采用二进制优化算法

Ø高精度连乘时缓存和缓存的设置

Ø改进的求平方算法

Ø二分法求乘幂

Ø分解质因数法求阶乘以及分解质因数后的调整

应用

Ø高精度求乘幂(平方)

Ø高精度求连乘(阶乘)

Ø高精度求排列组合


结束语

求N!的高精度算法本身并不难,但我们仍然可以从多种角度对它进行优化。

其实,很多经典算法都有优化的余地。我们自己编写的一些程序也不例外。只要用心去优化,说不准你就想出更好的算法来了。

也许你认为本文中的优化毫无价值。确实是这样,竞赛中对高精度的要求很低,根本不需要优化。而我以高精度算法为例,不过想谈谈如何优化一个算法。我想说明的只有一点:算法是可以优化的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值