问题描述:已知n个人(以编号1,2,3...n分别表示)围坐在一张圆桌周围。从编号为k的人开始报数,数到m的那个人出列;他的下一个人又从1开始报数,数到m的那个人又出列;依此规律重复下去,直到圆桌周围的人全部出列,求最后一个出列人的编号。
用循环的方法模拟这个过程的解,算法复杂度为O(m*n),不再讨论。
递归的力量:优化到O(N)
无论是用链表实现还是用数组实现都有一个共同点:要模拟整个游戏过程,不仅程序写起来比较烦,而且时间复杂度高达O(nm),当n,m非常大(例如上百万,上千万)的时候,几乎是没有办法在短时间内出结果的。我们注意到原问题仅仅是要求出最后的胜利者的序号,而不是要读者模拟整个过程。因此如果要追求效率,就要打破常规,实施一点数学策略。
为了讨论方便,先把问题稍微改变一下,并不影响原意:
问题描述:n个人(编号0~(n-1)),从0开始报数,报到(m-1)的退出,剩下的人继续从0开始报数。求胜利者的编号。
我们知道第一个人(编号一定是m%n-1) 出列之后,剩下的n-1个人组成了一个新的约瑟夫环(以编号为k=m%n的人开始):
k k+1 k+2 ... n-2, n-1, 0, 1, 2, ... k-2并且从k开始报0。
现在我们把他们的编号做一下转换:
k --> 0
k+1 --> 1
k+2 --> 2
...
...
k-2 --> n-2
k-1 --> n-1
变换后就完完全全成为了(n-1)个人报数的子问题,假如我们知道这个子问题的解:例如x是最终的胜利者,那么根据上面这个表把这个x变回去不刚好就是n个人情况的解吗?!!变回去的公式很简单,相信大家都可以推出来:x'=(x+k)%n
如何知道(n-1)个人报数的问题的解?对,只要知道(n-2)个人的解就行了。(n-2)个人的解呢?当然是先求(n-3)的情况 ---- 这显然就是一个倒推问题!好了,思路出来了,下面写递推公式:
令f[i]表示i个人玩游戏报m退出最后胜利者的编号,最后的结果自然是f[n]
递推公式
f[1]=0;
f[i]=(f[i-1]+m)%i; (i>1)
有了这个公式,我们要做的就是从1-n顺序算出f[i]的数值,最后结果是f[n]。因为实际生活中编号总是从1开始,我们输出f[n]+1
由于是逐级递推,不需要保存每个f[i],程序也是异常简单:
long Josephus(long n,long m,long start){ //参数分别为:人数,出圈步长,起使报数位置
long k = 1;
for (long i = 2; i <= n; i++)
k = (k + m ) % i;
return (k + start + 1) % n; //返回最后一人的位置
}
显然,这个算法的复杂度仅为O(n),相比模拟算法,有了很大的改进。
再优化:与人数无关
上面的算法相比最初的模拟算法效率已经大大提升了,那么,该算法还有改进的余地么?
事实上,如果我们观察上述算法中的变量k,他的初始值为第一个出圈人的编号,但在循环的过程中,我们会发现它常常处在一种等差递增的状态,我来看这个式子:k = (k + m) % i,可以看出,当i比较大而k比较小的时候,k就处于一种等差递增的状态,这个等差递增的过程并不是必须的,可以跳过。
我们设一中间变量x,列出如下等式:
k + m * x = i + x
解出x,令k = k + m * x,将i + x直接赋值给 i,这样就跳过了中间共x重的循环,从而节省了等差递增的时间开销。
可是其中求出来的x + i可能会超过n,这样的结果事实上已经告诉我们此时可以直接结束算法了,即:
k = k + m * (n - i) ;
i = n;
结束。
另外对于m = 1的情况可以单独讨论:
当start == 1时,最终结果就是n;
当start != 1时,最终结果就是(start + n - 1) % n。
整个算法的C语言描述如下:
long Josephus( long n, long m, long k ){ //分别为:人数,出圈步长,起使报数位置
long k = 1;
if (m == 1)
k = start == 1 ? n : (start + n) % n;
else{
for (long i = 1; i <= n; i++){
if ((k + m) < i){
x = (i - k + 1) / (m - 1) - 1;
if (i + x < n){
i = i + x;
k = (k + m * x);
}
else{
k = k + m * (n - i) ;
i = n;
}
}
k = (k + m ) % i + 1;
}
}
return k + 1; //返回最后一人的位置
}