快速幂
幂运算是非常常见的一种运算,求取an,最容易想到的方法便是通过循环逐个累乘,其复杂度为O(n),这在很多时候是不够快的,所以我们需要一种算法来优化幂运算的过程。
快速幂——反复平方法
该怎样去加速幂运算的过程呢?既然我们觉得将幂运算分为n步进行太慢,那我们就要想办法减少步骤,把其中的某一部分合成一步来进行。
比如,如果n能被2整除,那我们可以先计算一半,得到an/2的值,再把这个值平方得出结果。这样做虽然有优化,但优化的程度很小,仍是线性的复杂度。
再比如,如果我们能找到2k=n,那我们就能把原来的运算优化成((a2)2)2…,只需要k次运算就可以完成,效率大大提升。可惜的是,这种条件显然太苛刻了,适用范围很小。不过这给了我们一种思路,虽然我们很难找到2k=n,但我们能够找到2k1+2k2+2k3+…+2km=n。这样,我们可以通过递推,在很短的时间内求出各个项的值。
我们都学习过进制与进制的转换,知道一个b进制数的值可以表示为各个数位的值与权值之积的总和。比如,2进制数1001,它的值可以表示为10进制的1×23+0×22+0×21+1×20,即9。这完美地符合了上面的要求。可以通过2进制来把n转化成2km的序列之和,而2进制中第i位(从右边开始计数,值为1或是0)则标记了对应的2i−1是否存在于序列之中。譬如,13为二进制的1101,他可以表示为23+22+20,其中由于第二位为0,21项被舍去。
如此一来,我们只需要计算a、a2、a4、a8…a2km的值(这个序列中的项不一定都存在,由n的二进制决定)并把它们乘起来即可完成整个幂运算。借助位运算的操作,可以很方便地实现这一算法,其复杂度为O(logn)。
typedef long long ll;
ll mod;
ll qpow(ll a, ll n)//计算a^n % mod
{
ll re = 1;
while(n)
{
if(n & 1)//判断n的最后一位是否为1
re = (re * a) % mod;
n >>= 1;//舍去n的最后一位
a = (a * a) % mod;//将a平方
}
return re % mod;
}
取模运算一般情况下是需要的,当然也可以省去。
矩阵快速幂
需要进行幂运算的不仅仅只有整数,比如,在POJ3070 Fibonacci中,就需要我们快速地完成方阵的幂运算。知道了如何做快速幂,我们还可以将同样的思想运用在其他地方。除了乘法的规则与普通快速幂不同之外不同,其他的细节并没有什么差别。
实现矩阵快速幂的一种方法如下:
struct matrix//定义一个结构体,方便传递值
{
int m[maxn][maxn];
};
/*
maxn和mod由全局定义,其中mod根据需要可以省去
*/
matrix mat_multi(matrix a, matrix b)//矩阵求积
{
matrix ans;
for(int i = 0;i < maxn;i++)
{
for(int j = 0;j < maxn;j++)
{
ans.m[i][j] = 0;
for(int k = 0;k < maxn;k++)
{
ans.m[i][j] += (a.m[i][k] % mod * b.m[k][j] % mod) % mod;
ans.m[i][j] %= mod;
}
}
}
return ans;
}
matrix mat_quickpow(matrix a, int n)//矩阵快速幂
{
matrix ans;
for(int i = 0;i < maxn;i++)
{
for(int j = 0;j < maxn;j++)
{
if(i == j)
ans.m[i][j] = 1;
else
ans.m[i][j] = 0;//这里要初始化为单位矩阵,类比普通快速幂这里初始化为1
}
}
while(n != 0)//方法与普通快速幂相同,只有乘法的实现不同
{
if(n & 1)
ans = mat_multi(a, ans);
a = mat_multi(a, a);
n >>= 1;
}
return ans;
}