面试-题集

最新推荐文章于 2024-04-29 18:33:01 发布

Hou_Rj

最新推荐文章于 2024-04-29 18:33:01 发布

阅读量1.1k

点赞数

分类专栏：算法文章标签：面试算法 c java 磁盘 string

本文链接：https://blog.csdn.net/sunjerdege/article/details/6861704

版权

算法专栏收录该内容

14 篇文章 0 订阅

订阅专栏

【非递归遍历二叉树

http://hxraid.iteye.com/blog/507806#comments

C代码

1. #include<stdio.h>

2. #include<malloc.h>

4. typedef struct binode{

5. char data;

6. struct binode *lchild;

7. struct binode *rchild;

8. }BiNode,*BiTree;

9. /****************************

10. *输入创建二叉树： abd##ef###c##

11. *其实输入按照先序顺序，#表示叶子节点

12. *****************************/

13. void create(BiTree t){

14. char ch=(char)getchar();

15. if(ch=='#'){

16. t->data='#';

17. t->lchild=NULL;

18. t->rchild=NULL;

19. }

20. else{

21. t->data=ch;

22. t->lchild=(BiTree)malloc(sizeof(BiNode));

23. create(t->lchild);

24. t->rchild=(BiTree)malloc(sizeof(BiNode));

25. create(t->rchild);

26. }

27. }

28. //先序遍历

29. void preTraverse(BiTree t){

30. BiTree p=t;

31. BiTree stack[20]; //使用栈来替代递归方法

32. int top=0;

33. while(top>=0){

34. while(p->data!='#'){

35. printf("%c ",p->data);

36. stack[top++]=p;

37. p=p->lchild;

38. }

39. if(top>0)

40. p=stack[--top]->rchild;

41. else

42. top=-1;

43.

44. }

45. }

46. //中序遍历，和先序差不多

47. void midTraverse(BiTree t){

48. BiTree p=t;

49. BiTree stack[20];

50. int top=0;

51. while(top>=0){

52. while(p->data!='#'){

53. stack[top++]=p;

54. p=p->lchild;

55. }

56. if(top>0){

57. p=stack[--top];

58. printf("%c ",p->data);

59. p=p->rchild;

60. }else

61. top=-1;

62. }

63. }

64. //后序遍历，稍微复杂一点

65. void afeTraverse(BiTree t){

66. BiTree p=t,q=t;

67. BiTree stack[20];

68. int top=0;

69. while(top>=0){

70. while(p->data!='#'){

71. stack[top++]=p;

72. p=p->lchild;

73. }

74. if(q->rchild==p){

75. printf("%c ",q->data);

76. q->data='#'; //遍历完的节点直接做叶子标记

77. --top;

78. }

79. if(top>0){

80. p=stack[top-1];

81. q=p;

82. p=p->rchild;

83.

84. }

85. }

86. }

87. //测试

88. int main(){

89. BiTree root=(BiTree)malloc(sizeof(BiNode));

90. create(root);

91. afeTraverse(root);

92. printf("\n");

93. return 1;

94. }

/****************************************************************
* 迅雷笔试题：
* 有三个线程ID分别是A、B、C,请有多线编程实现，在屏幕上循环打印10次ABCABC…
*
* @author: heartraid
*****************************************************************/

代码1：

Java代码

1. /**

2. * 锁码：公共数据区

3. * 码值：码值为A，表示应该由A线程来执行，B,C线程等待

4. * 码值为B,C同理。

5. */

6. class LockCode{

7. /**当前锁码码值，初始码值为A，表示最初由A线程运行*/

8. private char code='A';

9. /**单例模式*/

10. private LockCode(){

11. }

12.

13. public static LockCode newInstance(){

14. return new LockCode();

15. }

16. /**

17. * 循环设置锁码

18. * 每一次调用，锁码按照A-B-C-A-...-的顺序循环往复

19. */

20. public void setCode(){

21. this.code=(char)(this.code+1);

22. if(this.code=='D')

23. this.code='A';

24. }

25. /**

26. * 得到锁码

27. */

28. public char getCode(){

29. return this.code;

30. }

31. }

32. /**

33. * 完成打印工作的线程类

34. */

35. class PrintRunnable implements Runnable{

36. /**需要打印的字符*/

37. private char character='?';

38. /**公共锁码*/

39. private LockCode lockCode=null;

40.

41. PrintRunnable(char c,LockCode l){

42. this.character=c;

43. this.lockCode=l;

44. }

45. /**

46. * 线程执行

47. */

48. public void run() {

49. int loopCount=1;

50. while(loopCount<=10){

51. synchronized(lockCode){//线程同步操作锁码

52. try{

53. //如果当前运行的线程并不等于当前锁码的码值，则改线程等待

54. //比如当前运行线程是A，但是码值为B，则A线程等待。

55. while(lockCode.getCode()!=this.character)

56. lockCode.wait();

57. //码值匹配成功，打印字符

58. System.out.print(this.character);

59. //循环10次记数

60. loopCount++;

61. //设置码值，让下一个线程可以运行

62. lockCode.setCode();

63. //让其他所有等待线程激活

64. lockCode.notifyAll();

65. }catch(InterruptedException e){

66. e.printStackTrace();

67. }

68. }

69. }

70. }

71.

72. }

73. /**

74. * 测试

75. */

76. public class ThreadLoopPrint {

77.

78. public static void main(String[] args) {

79. LockCode lockCode=LockCode.newInstance();//公共锁码

80. Thread ta=new Thread(new PrintRunnable('A',lockCode));

81. Thread tb=new Thread(new PrintRunnable('B',lockCode));

82. Thread tc=new Thread(new PrintRunnable('C',lockCode));

83. ta.start();

84. tb.start();

85. tc.start();

86. }

87. }

代码2：

Java代码

1. /**

2. *此代码和上面的代码有一个很大的相同点，就是都利用公共数据区中的数据变化来决定线程工作还是阻塞等待。公共数据区利用了类静态变量。因此代码简洁。

3. *

4. *@author jiangtao

5. *@date 2010-2-27

6. *@version 1.0

7. */

8. public class MyThread extends Thread{

10. public static String[] NAMES = new String[] { "A", "B", "C" };

11.

12. public static int POS = 0;

13.

14. private static final long DURATION = 1000;

15.

16. private int count = 10;

17.

18. public MyThread (String name) {

19. this.setName(name);

20. }

21.

22. @Override

23. public void run() {

24. while (count > 0) {

25. if (this.getName().equals(NAMES[POS])) {

26. this.print();

27. this.count--;

28. }

29. try {

30. Thread.sleep(DURATION);

31. } catch (InterruptedException e) {

32. e.printStackTrace();

33. }

34. }

35. }

36.

37. private synchronized void print() {

38. System.out.print(this.getName());

39. POS = (POS >= NAMES.length - 1 ? 0 : ++POS);

40. }

41.

42. public static void main(String[] args) {

43. new MyThread ("A").start();

44. new MyThread ("B").start();

45. new MyThread ("C").start();

46. }

47. }

【腾讯】连续数打乱判断出少了哪些数？

http://hxraid.iteye.com/blog/618153

1. 问题：100个连续的数打乱之后，随机取出1个数，问如何最快速的判断出少了哪一个？

分析：对于所有100个连续的数，只要除余100。一定在0~99之间。一般来说，比较常规的做法就是先排序（利用Hash表定位），在循环查找。当然时间复杂度是O(2n)。现在介绍一种很牛的O(n)做法：求二进制异或运算。

异或运算： 0^0=1^1=0; 0^1=1^0=1。0~99个数全部异或的结果只能是0。如果缺少一个数，那么全部异或的结果正好就是那个数。为什么呢？我们做个小实验：假如有四个数： 0001 0010,0101, 0110 排列成一个matrix.

bits: 1 2 3 4

0 0 0 1

0 0 1 0

0 1 0 1

0 1 1 0

全部异或： 0 0 0 0

我们可以下结论了，要全部异或的结果为0，那么所有bit位上的1的个数必须为偶数。 反过来说：如果其中有一个数不存在了（比如0001），那么少0的的bit位上的值不变(因为1的个数还是偶数)，而少1的bit位上的值就变成了1(1的个数为奇数了)。

这样0~99的道理也就一样了，所以异或的结果就是少的那个值。代码如下：

Java代码

1. int data=0;

2. for(int i=1;i<=99;i++){

3. if(i==78) //少78

4. continue;

5. data=data^i;

6. }

7. System.out.println(data);

2. 问题：100个连续的数打乱之后，随机取出2个数，问如何最快速的判断出少了哪两个？ (注意少2个数了)

分析：常用的做法可以先创建一个100个结构的Hash表，然后循环一次将所有数哈希100之后的位置上置1。然后顺序循环100次查找这个Hash表。前后需要O(2n)的时间。然而有没有更快速的做法呢？当然，直接操作bit.

假设我们有32个连续打乱的数字(0~31)缺少两个数2和11，希望把标记1标记在一个32位上。也就是一个整形变量，标记完之后就成为了：

bits position 31 30 29 28 ....... 11 10 .... 2 1 0

int a= 1 1 1 1 ....... 0 1 .... 0 1 1 (缺少数的bit位上为0)

至于如何标记成为a，我们可以看看下面的小段代码：

Java代码

1. long bits=0;

2. for(int i=0;i<32;i++){

3. long bitMove=1;

4. if(i==2||i==11)

5. continue;

6. bitMove=bitMove<<i;

7. bits=bits | bitMove;

8. System.out.println(bits+" ： "+Long.toBinaryString(bits));

9. }

此时我们将数字a每8位作为一个数字b，如果b==255, 则说明全部8位都是1(没有缺少数字)。如果b!=255，则说明有某些位是0(有数字缺少)，然后再在不等于255的8 bits上顺序查找等译0的位数即可。这样就相当于原来需要顺序查找32 bits(查找32次)。而现在只需要先查找4个8位的块，然后再需找某个8位块中的bit（也就是需要4+8=12次）即可。这就是分块查找的基本原理了。

通过一个32个连续的数，我们发现了敲门。这样对于100个连续的数呢？很简单，我们需要4个32位就够了。注意：由于最高位如果是1的话，整形数据将会变成负数，不方便我们的计算。因此我们用long数据来存储32个位数。

代码如下：

Java代码

1. public class Test{

3. public static void main(String[] args){

4. //需要4个32位数据，用long存储为了避开int存储可能带来的负数。

5. //intBits[0]的最低32位标识数据0~31

6. //intBits[1]的最低32位标识数据32~63，

7. //intBits[2]的最低32位标识数据64~95,

8. //intBits[3]的最低4位标识数据96~99

9. long[] intBits={0L,0L,0L,0L};

10.

11. //用100bit位标识是否存在0~99的数据

12. //此时需要循环的次数为100次，时间复杂度O(n)，n为连续的data数量。

13. int loop=0;

14. for(int data=0;data<=99;data++){

15. long bitMove=1;

16. if(data==2||data==11) //缺少数据2和11

17. continue;

18. bitMove=bitMove<<(data-32*(data/32));

19. intBits[data/32]=intBits[data/32] | bitMove;

20. loop++;

21. }

22. //中间打印标识结果

23. System.out.print("标识结果(循环"+loop+"次)：");

24. for(int i=3;i>=0;i--)

25. System.out.print(Long.toBinaryString(intBits[i]));

26. System.out.println();

27.

28. //分块查找，每8bit一块，一共需要100/8=13块

29. //其中如果8bit全部是1,则该数据等于2^8-1=255

30. //前3个intBits都全部位数都用来标识数据

31. loop=0;

32. int zeroSize=0;

33. for(int i=0;i<4;i++){

34. long bits=intBits[i];

35. long eightBits=0;

36. int eightSize=0;

37. while((eightBits=bits%256)!=0){

38. System.out.println("第"+((eightSize+1)+i*4)+"个8bits块:"+Long.toBinaryString(eightBits));

39. if(i<3&&eightBits!=255){

40. for(int j=0;j<8;j++){

41. loop++;

42. if(eightBits%2==0){

43. zeroSize=j+eightSize*8+i*32;

44. System.out.println(" zero size="+zeroSize);

45. }

46. eightBits=eightBits>>1;

47. }

48. }

49. bits=bits/256;

50. eightSize++;

51. loop++;

52. }

53. }

54.

55. System.out.println("标识后查找需要循环"+loop+"次");

56.

57. }

58. }

这段代码只需要循环98+29=117次，少于一般情况下的200次。

3. 问题：有1到10w这10w个数，去除2个并打乱次序，如何找出那两个数？（不准用位图）

我想用分块查找的思想，首先开辟一个a[100][1001]存储结构，遍历10W个数存放这个结构

Java代码

1. int[][] a=new[100][1001];

2. for(int i=0;i<99998){

3. a[i/1000-1][i%1000+1]=1;

4. a[i/1000-1][0]++; //记1000个数是否已经满了。

5. }

7. for(int j=0;j<100;j++){

8. if(a[j][0]<1000){ //这1000个数里面有数少了

9. for(int k=1;k<1000;i++){

10. if(a[j][k]!=1){

11. System.out.println("少了的呢个数就是："+(j*1000+k));

12. }

13. }

14. }

15. }

性能分析：首先循环99998次为数组设置标志位。然后双重循环(其实真正需要双循环的是有2次，因为就少了2个数)，因此双重循环的次数因该是： 100（块查找次数）+2*1000=2100次。
一共循环99998+2100 因此效率是O(n+m) 其中n为待查找数字的个数(10W),m为分割的块数与快内查找的次数。如果n远远大于m，则查询效率接近于O(n)。因此这种查找数据越多效率越好。

【腾讯】报纸与信件的字符匹配效率问题

http://hxraid.iteye.com/blog/627859

题目：有一个江洋大盗，他每次写信都是从一张报纸上剪下单词，再把单词贴在信上。假如某张报纸的单词保存在vector<string>paper 中，而信的单词保存在vector<string>letter 中，写一个算法程序判别该报纸可不可以生成该信？

对比一些方法：这里假设paper:(m个单词，每个单词平均d个字母),letter:(n个单词，每个单词平均d个字母)。对于中文词语而言，一般2~4个字左右，对于英文单词，d就要大一点，但基本上也是常数。因此d远远小于m，下面比较的时候就不考虑单词中每个字符间的比较了。

(1) 蛮力匹配：
    把n中每个单词与m中的每个单词一一比较。时间复杂度为：O(m*n)。估计谁也不会选这种。

(2) 二分查找：要求，对paper建有序索引。
    paper排序的时间复杂度最好为O(m*logm)。
    对letter中的所有单词二分查找的时间复杂度为O(n*logm)
    总的时间复杂度为O((m+n)*logm). 比蛮力查找效率要好不少。

    缺点：如果换了新报纸，所有的单词都必须重新排序，需要O(m*logm)的时间来建立索引。

(3) trie树：要求，对paper建trie索引树

    paper建立trie树的时间复杂度为O(m)。
    对letter中所有单词在trie树中查找的时间复杂度为O(n).
    总的时间复杂度为O(m+n)。效率绝对要比二分查找好。

    优势: 如果换了新报纸，重新建立一颗trie树的时间O(m)也小于二分查找建立有序索引的时间O(m*logm)要小的多。

    缺点：建立trie树所需要的空间代价是很大的。如果是中文词语的trie树，那么放进全部加载进内存是很可怕的，需要把trie树用B树的方法存储在磁盘上。详见：《Trie树》

(4) Hash表：要求，对paper建立Hash结构

    建立Hash表结构的时间复杂度为O(m)，注意需要计算每个单词的HashCode的时候，很可能要遍历单词中的每个字母。
    对letter中所有单词在Hash结构中查找的时间复杂度为O(n)。当然，这是在没有任何散列冲突的理想情况下。选择好HashCode的计算方式和散列表的大小，可以将冲突降到很低。因此我们这里不考虑冲突。
    总的时间复杂度为O(m+n)。由此可见，Hash表结构与Trie树的效率都是相当的客观。

    缺点：如果换报纸。为了考虑冲突的可能性，Hash结构的大小可能需要重新考虑。这一点很麻烦。当然，存储空间上应该会比Trie要好一些，但实际应用上并不比Trie方便。

(5) 归并查找：要求，对letter和paper都建立有序索引。

    对letter和paper排序的时间复杂度分别为O(m*logm)和O(n*logn)
    归并查找的时间复杂度为O(m+n)
    总的时间复杂度为O(m*logm+n*logn+m+n)

总结：对于这几种方法而言，我更加青睐于trie树。因为我相信报纸中的单词数量基本上是保持稳定的，不可能达到海量级别。Trie树的空间代价其实并不算什么。

【腾讯】10G整数文件中寻找中位数

http://hxraid.iteye.com/blog/649831

题目：在一个文件中有 10G 个整数，乱序排列，要求找出中位数。内存限制为 2G。只写出思路即可（内存限制为 2G的意思就是，可以使用2G的空间来运行程序，而不考虑这台机器上的其他软件的占用内存）。

分析：既然要找中位数，很简单就是排序的想法。那么基于字节的桶排序是一个可行的方法（请见《桶排序》）：

思想：将整形的每1byte作为一个关键字，也就是说一个整形可以拆成4个keys，而且最高位的keys越大，整数越大。如果高位keys相同，则比较次高位的keys。整个比较过程类似于字符串的字典序。

第一步:把10G整数每2G读入一次内存，然后一次遍历这536,870,912个数据。每个数据用位运算">>"取出最高8位(31-24)。这8bits(0-255)最多表示255个桶，那么可以根据8bit的值来确定丢入第几个桶。最后把每个桶写入一个磁盘文件中，同时在内存中统计每个桶内数据的数量，自然这个数量只需要255个整形空间即可。

代价：(1) 10G数据依次读入内存的IO代价(这个是无法避免的，CPU不能直接在磁盘上运算)。(2)在内存中遍历536,870,912个数据，这是一个O(n)的线性时间复杂度。(3)把255个桶写会到255个磁盘文件空间中，这个代价是额外的，也就是多付出一倍的10G数据转移的时间。

第二步：根据内存中255个桶内的数量，计算中位数在第几个桶中。很显然，2,684,354,560个数中位数是第1,342,177,280个。假设前127个桶的数据量相加，发现少于1,342,177,280，把第128个桶数据量加上，大于1,342,177,280。说明，中位数必在磁盘的第128个桶中。而且在这个桶的第1,342,177,280-N(0-127)个数位上。N(0-127)表示前127个桶的数据量之和。然后把第128个文件中的整数读入内存。(平均而言，每个文件的大小估计在10G/128=80M左右，当然也不一定，但是超过2G的可能性很小)。

代价：(1)循环计算255个桶中的数据量累加，需要O(M)的代价，其中m<255。(2)读入一个大概80M左右文件大小的IO代价。

注意，变态的情况下，这个需要读入的第128号文件仍然大于2G，那么整个读入仍然可以按照第一步分批来进行读取。

第三步：继续以内存中的整数的次高8bit进行桶排序(23-16)。过程和第一步相同，也是255个桶。

第四步：一直下去，直到最低字节(7-0bit)的桶排序结束。我相信这个时候完全可以在内存中使用一次快排就可以了。

整个过程的时间复杂度在O(n)的线性级别上(没有任何循环嵌套)。但主要时间消耗在第一步的第二次内存-磁盘数据交换上，即10G数据分255个文件写回磁盘上。一般而言，如果第二步过后，内存可以容纳下存在中位数的某一个文件的话，直接快排就可以了。关于快排的效率，可以看看我博客中的数据《基于比较的内部排序总结》。

【腾讯】1亿个数据取前1万大的整数

数据规模分析

不考虑操作系统的区别，通常将C++中的一个整型变量认为4bytes。那么1亿整型需要400M左右的内存空间。当然，就现代PC机而言，连续开辟400M的内存空间还是可行的。因此，下面的讨论只考虑在内存中的情况。为了讨论方便，假设M=1亿，N=1万。

用大拇指想想

略微考虑一下，使用选择排序。循环1万次，每次选择最大的元素。源代码如下：

Cpp代码

1. //解决方案1，简单选择排序

2. //BigArr[]存放1亿的总数据、ResArr[]存放1万的总数据

3. void solution_1(int BigArr[], int ResArr[] ){

4. for( int i = 0; i < RES_ARR_SIZE; ++i ){

5. int idx = i;

6. //选择最大的元素

7. for( int j = i+1; j < BIG_ARR_SIZE; ++j ){

8. if( BigArr[j] > BigArr[idx] )

9. idx = j;

10. }

11. //将最大元素交换到开始位置

12. ResArr[i] = BigArr[idx];

13. std::swap( BigArr[idx], BigArr[i] );

14. }

15. }

性能分析：哇靠！时间复杂度为O(M*N)。有人做过实验《从一道笔试题谈算法优化（上）》，需要40分钟以上的运行时间。太悲剧了......

当然，用先进的排序方法(比如快排)，时间复杂度为O(M*logM)。虽然有很大的改进了，据说使用C++的STL中的快排方法只需要32秒左右。确实已经达到指数级的优化了，但是否还能够优化呢？

稍微动下脑子

我们只需要1万个最大的数，并不需要所有的数都有序，也就是说只要保证的9999万个数比这1万个数都小就OK了。我们可以通过下面的方法来该进：

(1) 先找出M数据中的前N个数。确定这N个数中的最小的数MinElement。

(2) 将 (N+1) —— M个数循环与MinElement比较，如果比MinElement还小，则不处理。如果比MinElement大，则与MinElement交换，然后重新找出N个数中的MinElement。

Cpp代码

1. //解决方案2

2. void solution_2( T BigArr[], T ResArr[] ){

3. //取最前面的一万个

4. memcpy( ResArr, BigArr, sizeof(T) * RES_ARR_SIZE );

5. //标记是否发生过交换

6. bool bExchanged = true;

7. //遍历后续的元素

8. for( int i = RES_ARR_SIZE; i < BIG_ARR_SIZE; ++i ){

9. int idx;

10. //如果上一轮发生过交换

11. if( bExchanged ){

12. //找出ResArr中最小的元素

13. int j;

14. for( idx = 0, j = 1; j < RES_ARR_SIZE; ++j ){

15. if( ResArr[idx] > ResArr[j] )

16. idx = j;

17. }

18. }

19. //这个后续元素比ResArr中最小的元素大，则替换。

20. if( BigArr[i] > ResArr[idx] ){

21. bExchanged = true;

22. ResArr[idx] = BigArr[i];

23. }else

24. bExchanged = false;

25. }

26. }

性能分析：最坏的时间复杂度为O((M-N)*N)。咋一看好像比快排的时间复杂度还高。但是注意是最坏的，实际上，并不是每次都需要付出一个最小值O(N)的代价的。因为，如果当前的BigArr[i]<ResArr[idx]的话，就不需要任何操作，则1——N的最小值也就没有变化了。下一次也就不需要付出O(N)的代价去寻找最小值了。当然，如果M基本正序的话，则每次都要交换最小值，每次都要付出一个O(N)代价。最坏的情况比快排还要差。

就平均性能而言，改进的算法还是比快排要好的，其运行时间大约在2.0秒左右。

使劲动下脑子

上面的解决方案2还有一个地方不太好。当BigArr[i]>ResArr[idx]时，则必须交换这两个数，进而每次都需要重新计算一轮N个数的最小值。只改变了一个数就需要全部循环一次N实在是不划算。能不能下一次的最小值查找可以借助上一次的比较结果呢？

基于这样一个想法，我们考虑到了堆排序的优势(每一次调整堆都只需要比较logN的结点数量)。因此我们再做一次改进：

(1) 首先我们把前N个数建立成小顶堆，则根结点rootIdx。

(2) 当BigArr[i]>ResArr[rootIdx]时，则交换这两个数，并重新调整堆，使得根结点最小。

性能分析：显然，除了第一次建堆需要O(N)时间的复杂度外，每一次调整堆都只需要O(logN)的时间复杂度。因此最坏情况下的时间复杂度为O((M-N)*logN)，这样即使在最坏情况下也比快排的O(M*logM)要好的多了。

另外：实际上也可以使用二分查找的思想，第一次找N中的最小值的时候将N排序。以后每次替换最小值，都使用二分查找在logN代价下找到当前N的最小值即可。与使用堆的过程如出一辙。

【腾讯】快速找到未知长度单链表的中间节点

普通的方法很简单，首先遍历一遍单链表以确定单链表的长度L。然后再次从头节点出发循环L/2次找到单链表的中间节点。算法复杂度为O(L+L/2)=O(3L/2)。

能否再优化一下这个时间复杂度呢？有一个很巧妙的方法：设置两个指针* fast、*slow都指向单链表的头节点。其中* fast的移动速度是* slow的2倍。当* fast指向末尾节点的时候，slow正好就在中间了。

C源代码如下：

Java代码

1. void locate(LinkedList *head){

2. LinkedList *fast, *slow;

3. fast=slow=head;

4. while(fast->next!=NULL){

5. //fast的移动速度是slow的2倍

6. if(fast->next->next!=Null){

7. fast=fast->next->next;

8. slow=slow->next;

9. }else{

10. fast=fast->next;

11. }

12. }

13. }

另外，快慢指针在解决单链表环问题的时候是非常有用的，具体请参见《★经典问题—链表中的环问题》

【Google】25匹马的角逐

问题是这样的：一共有25匹马，有一个赛场，赛场有5个赛道，就是说最多同时可以有5匹马一起比赛。假设每匹马都跑的很稳定，不用任何其他工具，只通过马与马之间的比赛，试问最少得比多少场才能知道跑得最快的5匹马。

注意： "假设每匹马都跑的很稳定" 的意思是在上一场比赛中A马比B马快，则下一场比赛中A马依然比B马快。

稍微想一下，可以采用一种竞标赛排序(Tournament Sort)的思路。 见《选择排序》

(1) 首先将25匹马分成5组，并分别进行5场比赛之后得到的名次排列如下：

A组： [A1 A2 A3 A4 A5]

B组： [B1 B2 B3 B4 B5]

C组： [C1 C2 C3 C4 C5]

D组： [D1 D2 D3 D4 D5]

E组： [E1 E2 E3 E4 E5]

其中，每个小组最快的马为[A1、B1、C1、D1、E1]。

(2) 将[A1、B1、C1、D1、E1]进行第6场，选出第1名的马，不妨设 A1>B1>C1>D1>E1. 此时第1名的马为A1。

(3) 将[A2、B1、C1、D1、E1]进行第7场，此时选择出来的必定是第2名的马，不妨假设为B1。因为这5匹马是除去A1之外每个小组当前最快的马。

(3) 进行第8场，选择[A2、B2、C1、D1、E1]角逐出第3名的马。

(4) 依次类推，第9，10场可以分别决出第4，5名的吗。

因此，依照这种竞标赛排序思想，需要10场比赛是一定可以取出前5名的。

仔细想一下，如果需要减少比赛场次，就一定需要在某一次比赛中同时决出2个名次，而且每一场比赛之后，有一些不可能进入前5名的马可以提前出局。 当然要做到这一点，就必须小心选择每一场比赛的马匹。我们在上面的方法基础上进一步思考这个问题，希望能够得到解决。

(1) 首先利用5场比赛角逐出每个小组的排名次序是绝对必要的。

(2) 第6场比赛选出第1名的马也是必不可少的。假如仍然是A1马(A1>B1>C1>D1>E1)。那么此时我们可以得到一个重要的结论：有一些马在前6场比赛之后就决定出局的命运了(下面绿色字体标志出局)。

A组： [A1 A2 A3 A4 A5]

B组： [B1 B2 B3 B4 B5 ]

C组： [C1 C2 C3 C4 C5 ]

D组： [D1 D2 D3 D4 D5 ]

E组： [E1 E2 E3 E4 E5 ]

(3) 第7场比赛是关键，能否同时决出第2，3名的马呢？我们首先做下分析：

在上面的方法中，第7场比赛[A2、B1、C1、D1、E1]是为了决定第2名的马。但是在第6场比赛中我们已经得到(B1>C1>D1>E1)，试问？有B1在的比赛，C1、D1、E1还有可能争夺第2名吗？当然不可能，也就是说第2名只能在A2、B1中出现。实际上只需要2条跑道就可以决出第2名，剩下C1、D1、E1的3条跑道都只能用来凑热闹的吗？

能够优化的关键出来了，我们是否能够通过剩下的3个跑道来决出第3名呢？当然可以，我们来进一步分析第3名的情况？

● 如果A2>B1(即第2名为A2)，那么根据第6场比赛中的(B1>C1>D1>E1)。可以断定第3名只能在A3和B1中产生。

● 如果B1>A2(即第2名为B1)，那么可以断定的第3名只能在A2, B2,C1 中产生。

好了，结论也出来了，只要我们把[A2、B1、A3、B2、C1]作为第7场比赛的马，那么这场比赛的第2，3名一定是整个25匹马中的第2，3名。

我们在这里列举出第7场的2，3名次的所有可能情况：

① 第2名=A2，第3名=A3

② 第2名=A2，第3名=B1

③ 第2名=B1，第3名=A2

④ 第2名=B1，第3名=B2

⑤ 第2名=B1，第3名=C1

(4) 第8场比赛很复杂，我们要根据第7场的所有可能的比赛情况进行分析。

① 第2名=A2，第3名=A3。那么此种情况下第4名只能在A4和B1中产生。

● 如果第4名=A4，那么第5名只能在A5、B1中产生。

● 如果第4名=B1，那么第5名只能在A4、B2、C1中产生。

不管结果如何，此种情况下，第4、5名都可以在第8场比赛中决出。其中比赛马匹为[A4、A5、B1、B2、C1]

② 第2名=A2，第3名=B1。那么此种情况下第4名只能在A3、B2、C1中产生。

● 如果第4名=A3，那么第5名只能在A4、B2、C1中产生。

● 如果第4名=B2，那么第5名只能在A3、B3、C1中产生。

● 如果第4名=C1，那么第5名只能在A3、B2、C2、D1中产生。

那么，第4、5名需要在马匹[A3、B2、B3、C1、A4、C2、D1]七匹马中产生，则必须比赛两场才行，也就是到第9场角逐出全部的前5名。

③ 第2名=B1，第3名=A2。那么此种情况下第4名只能在A3、B2、C1中产生。

情况和②一样，必须角逐第9场

④ 第2名=B1，第3名=B2。那么此种情况下第4名只能在A2、B3、C1中产生。

● 如果第4名=A2，那么第5名只能在A3、B3、C1中产生。

● 如果第4名=B3，那么第5名只能在A2、B4、C1中产生。

● 如果第4名=C1，那么第5名只能在A2、B3、C2、D1中产生。

那么，第4、5名需要在马匹[A2、B3、B4、C1、A3、C2、D1]七匹马中产生，则必须比赛两场才行，也就是到第9场角逐出全部的前5名。

⑤ 第2名=B1，第3名=C1。那么此种情况下第4名只能在A2、B2、C2、D1中产生。

● 如果第4名=A2，那么第5名只能在A3、B2、C2、D1中产生。

● 如果第4名=B2，那么第5名只能在A2、B3、C2、D1中产生。

● 如果第4名=C2，那么第5名只能在A2、B2、C3、D1中产生。

● 如果第4名=D1，那么第5名只能在A2、B2、C2、D2、E2中产生。

那么，第4、5名需要在马匹[A2、B2、C2、D1、A3、B3、C3、D2、E1]九匹马中产生，因此也必须比赛两场，也就是到第9长决出胜负。

总结：最好情况可以在第8场角逐出前5名，最差也可以在第9场搞定。

【找一个数组中的主元素

问题：在一个规模为N的数组array[N]中，所谓主元素就是出现次数大于N/2的元素，例如

3.3.4.2.4.4.2.4.4 有一个主元素为4。

给出一个算法，如果过半元素存在，就找出来，否则给出报告，要求给出O(N)的算法。

常规想法

(1) 穷举：找出元素中每一个数在数据中的数量。时间复杂度O(N^2)

(2) 排序：先对数组快排，然后重头开始遍历一遍计算每个数的数量。时间复杂度O(N*logN+N)

经典算法 裁剪数组算法, 时间复杂度为O(2N )

思想：如果一个数组array[N]，其中有两个元素e1和e2。

(1) e1不等于e2

假如e1是数组array[N]的主元素，e2不是。那么e1在array[N]中的数量en>N/2。此时去掉array[N]中的e1和e2两个元素(e1!=e2)。那么新数组array[N-2]中e1的数量为en-1，并且en-1>N/2-1=(N-2)/2。即e1还是新数组array[N-2]的主元素。

假如e1和e2都不是数组array[N]的主元素，那么去掉e1、e2以后。那么新数组的大小将变成N-2。此时很有可能出现一个新数组的主元素X，此主元素X的数量正好等于X=(N-2)/2+1。但是该主元素就不是原数组的主元素了，因为X= (N-2)/2+1=N/2。那么这样的主元素X我们叫做伪主元素。因此需要通过和裁剪掉元素比较，来确定是否是真正的主元素。

(2) e1等于e2

这种情况下不能进行裁剪。只能继续找不同的两个数裁减掉

C代码

1. #include<stdio.h>

2. #include<malloc.h>

3. // 算法源代码，裁剪当前数组中相邻的不同元素

4. void main(){

5. int pArr[6]={4,4,4,4,6,6};

6. int arrLength=6; //数组长度

7. int element=pArr[0];

8. int value=1; //记录剪裁过程中遇到相同元素的个数

9. int delNum=0; //记录裁剪数组的元素个数

10. int *dArr=(int *)malloc(arrLength*sizeof(int)); //记录被剪裁的数组元素

11. int dTop=0; //当前剪裁数组的索引位置

12.

13. for(int i=1;i<arrLength;i++){

14. if(value==0){

15. element=pArr[i];

16. }

17. if(pArr[i]==element) //如果当前数组相邻的元素相等

18. value++;

19. else if(value>0){//如果当前数组相邻的元素不等，则需要裁剪得到新的数组

20. dArr[dTop++]=element;

21. dArr[dTop++]=pArr[i];

22. delNum+=2;

23. value--;

24. }

25. }

26. //如果裁剪之后出现了主元素，那么这个主元素有可能是个伪主元素

27. if(value>(arrLength-delNum)/2){

28. //与裁剪掉的数组元素一一比较

29. for(int j=0;j<delNum;j++)

30. if(element==dArr[j]) value++;

31. //确定真正的主元素

32. if(value>arrLength/2)

33. printf("主元素为:%d\n",element);

34. }

<游戏> 取石子

Tang和Jiang非常喜欢玩一种有趣的小游戏: 有N个石子，两人轮流从中取出1个, 3个或4个石子，当石子被取空时，游戏结束。最后一个取石子的人获胜, 第一次总是Tang取. 当然，他们俩都足够聪明，总会采取最优的策略。

Input
每行会有一个正整数N(N<=100000), 代表石子的个数, N=0 代表输入结束
Output
输出获胜人的名字。

Sample Input
1 //石头数量为1
2
0
Sample Output
Tang //石头数量为1的时候，总是Tang会赢
Jiang

分治法：穷举出所有可能的取石头方案。

算法思想，假设两个玩家分别pid编号为0和1。f(n, pid)表示当前一轮获胜的玩家编号（如果f=0，表示获胜玩家是0），其中n表示当前一轮的石头总数，pid表示当前一轮的玩家标号。

考虑分治算法的思想，当前一轮的胜负结果取决于对下一轮各种情况的结果的统计。这个统计有两种情况：

1、当前一轮玩家pid=0，那么他取石头的可能性为1，3或4。则下一轮玩家pid=1的情况有三种： f(n-1, 1)，f(n-3,1)，f(n-4,1)。如果这三种情况的f()函数值至少有一个是0，不妨假设f(n-1, 1)=0，根据题目条件的"他们俩都足够聪明，总会采取最优的策略。 " ，那么当前一轮pid=0的玩家一定会选择取1个石头，结果也一定是pid=0赢。

因此当pid=0时， f(n ,0)=f(n-1, 1)&f(n-3, 1)&f(n-4, 1)

2、当前一轮玩家pid=1，那么下一轮三种情况下只要有一个f()函数值为1，则结果一定是pid=1赢。即

当pid=1是， f(n ,1)=f(n-1, 0)|f(n-3, 0)|f(n-4, 0)

下面是源代码：

Java代码

1. public class RecurStonePlay {

2. private static final String[] PLAYER={"Tang","Jiang"};

3. /**

4. * 当前轮到第pIdx个PLAYER从剩下的stoneNum块石头中取石头获胜的情况

5. * @param stoneNum 当前石头总数

6. * @param pIdx 取石头的人的ID

7. * @return 在当前这种情况下，能够取胜的PLAYER的ID

8. */

9. public static int turn(int stoneNum,int pIdx){

10.

11. //当前只有1,3,4块石头时，则当前PLAYER[pIdx]能够取胜

12. if(stoneNum==1||stoneNum==3||stoneNum==4) return pIdx;

13. //当前只有2块石头时，则PLAYER[(pIdx+1)%2]能取胜

14. if(stoneNum==2) return (pIdx+1)%2;

15.

16. //如果当前是PLAYER[0]取石头，则只要取1,3,4块三种情况中一种情况下能够取胜，则PLAYER[0]获胜。

17. //使用&运算，如果有一个0，则结果为0

18. if(pIdx==0)

19. return turn(stoneNum-1,(pIdx+1)%2)&turn(stoneNum-3,(pIdx+1)%2)&turn(stoneNum-4,(pIdx+1)%2);

20. //与上面情况相反，如果有一个1，则结果为1

21. else

22. return turn(stoneNum-1,(pIdx+1)%2)|turn(stoneNum-3,(pIdx+1)%2)|turn(stoneNum-4,(pIdx+1)%2);

23. }

24.

25. //测试

26. public static void main(String[] args) {

27. //石头总数为5块，PLAYER[0]开始先玩

28. System.out.println(PLAYER[RecurStonePlay.turn(5,0)]);

29. }

30. }

上面的方法时间复杂度太高，那么是否能够通过对当前一轮石头总数的判断，可以知道是当前玩家赢(先手赢)，还是下一轮的玩家赢(后手赢)呢?

我们假设先手玩家是Player1，后手玩家是Player2。用上面的程序运行1-30个石头，并输出赢的情况(其中0代表Player1赢，1代表Player2赢)。

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

0 1 0 0 0 0 1 0 1 0 0 0 0 1 0 1 0 0 0 0 1 0 1 0 0 0 0 1 0 1

我们可以发现，凡是mod 7 余2或0的石头数目，都是后手赢，其他情况都是先手赢。我们来证明一下：

(1) stoneNum=1,2,3,4时就不证明了。

(2) 当stoneNum=2的时候，是Player2赢。我们能够想到，如果Player1抽取石头后，能使得Player2玩的时候手头上的石头数量为2。那么Player1一定赢。也就是说(2+1=3)，(2+3=5)，(2+4=6)的石头数量一定导致Player1赢。

(3) 当stoneNum=7的时候，Player1无论抽1，3，4块石头中的任意情况，都会使得Player2玩的时候手头上的石头数量为6，4，3。这三种石头数量都是当前玩家赢（Player2赢）。因此7块石头一定是Player2赢。

(4) 当stoneNum=7的时候，情况与(2)相同。因此(7+1=8)，(7+3=10)，(7+4=11)的石头数量一定是Player1赢。

(5) 当stoneNum=9的时候，情况与(3)相同。因此9块石头一定是Player3赢。

(6) 依次下去，我们就能够得出这个结论：

策略：如果当前石头数量stoneNum%7==2||stoneNum%7==0，那么一定是后手赢。除此之外是先手赢。

<算法书>子数组换位问题

子数组换位问题

设a[0:n-1]是一个有n个元素的数组，k(0<=k<=n-1)是一个非负整数。试设计一个算法将子数组a[0:k]与a[k+1,n-1]换位。要求算法在最坏情况下耗时O(n),且只用到O(1)的辅助空间 (来自《计算机算法设计与分析》- 王晓东 - 第三章 - 递归与分治策略 - 课后习题 )

初步思考：最简单的方法就是循环(n-k-1)次，将a数组的末尾数字插入到a[0]之前。

具体做法：(1) 首先开辟一个额外空间temp用于存放每一次a数组的末尾数据。

(2) temp <- a[n-1]

(3) 将a[0: n-2] 每个数据都依次向后移动一位赋值给a[1: n-1]。

(4) a[0] <- temp

(5) 循环执行(2) -(4) 步 (n-k+1)次。

代价分析：时间代价—— O((n-1)*(n-k+1)) 即O(n^2)数量级；空间代价——O(1)

我们仔细想想还有没有更快的办法呢？试想一下，如果a[0 : k] 与 a[k+1 : n-1] 正好长度相等，则可以直接一一对应交换即可。当然，这道题的难点就在于k并不一定是a数组的中间位置。即便如此，但是仍然可以交换：

如果a[0 : k].length< a[k+1 : n-1].length，则可以将a[0 : k] 与 a[k+1 : n-1] 中最后一部分大小相同的数据交换：

|-------- a[k+1 : n-1] -----------|

a[0:k] a[k+1 : n-k-2] a[n-k-1 : n-1]

其中 a[0:k] 与 a[n-k-1 : n-1] 长度相同，因此完全可以一一对应交换成：