编程珠玑第二章习题答案

最新推荐文章于 2018-06-17 17:14:04 发布

长弓的坚持

最新推荐文章于 2018-06-17 17:14:04 发布

阅读量2k

点赞数 3

分类专栏：编程珠玑

编程珠玑专栏收录该内容

31 篇文章 4 订阅

订阅专栏

转载自互联网，并做了修改

1、提供单词和词典，找到该单词的所有变位词，可以事先花时间和空间处理下该词典。

为了找出给定单词的所有变位词，首先是计算给定单词的标识。如果不允许预处理，只能够顺序读取文件，然后求出读入文件的标识然后与给定单词的标志比较，然后得出结论。

如果允许预处理，那么就预先对字典进行按标识的排序，然后进行二分搜索，然后找到给定单词的在字典中的起点start和终点end。然后end-start+1得到改单词的所有变位词个数。同时也可以求出它的所有变位词。

2、给定一个4300000000个32位整数的顺序文件，请问你如何可以找到一个至少出现两次的整数

因为2^32>4300000000所以肯定存在至少出现两次的整数

而且是顺序文件，更提醒我们要用二分查找法

方法1：

（1）把所有整数（N个）看成二进制表示法，将第一位bit为1的数目和第一位bit为0的比较，必有一个数目大于等于另一个。把要找的重复的数的该位设置为1或者是0（取决于该位1或0哪个多设置为哪个）在数目大的那堆数字中继续比较第二bit位，按照1的方法比较，以此类推最后能得到重复出现的数字。这种思路与之前找40亿个数中遗失的数思路一样。

方法2：

由于4.3G>32位的整数空间，根据鸽笼原理，肯定会有重复的整数。注意二分查找的时候缩小的是数值的范围，因为输入是顺序的，所以当缩小数值范围的时候，我们也不用再一次的遍历整个文件了，只用搜索到数值的范围就为止。所以这种方案不能够保证每次迭代都讲整数数目减半。因为存在数字相等的情况。所以O(log(2)n)趟搜索的最坏情况下的时间复杂度是O(nlog(2)n).比如当所有的数字都相等的时候就是最坏的一个情况。

每次缩小范围的时候有可能比较大的那一个部分包含了大部分甚至是所有的数，下一次扫描就仍然需要n次，由于总共需要logn次扫描，所以结果是O(nlogn)。

搜索范围从所有的32位正整数开始（全部当成unsigned int，简化问题），即[0, 2^32)，中间值即为2^31。然后遍历文件，如果小于2^31的整数个数大于N/2=2^31，则调整搜索范围为[0, 2^31]，反之亦然；因为是顺序文件，下一次遍历的时候只用遍历到最后一个2^31就可以了，接下来继续按上面步骤进行，直到得到最后的结果。

例子：数组[4,2,5,1,3,6,3,7,0,7]，根据范围，最多就是3bit。首先从3位的整数空间内搜索。第一次的范围为[0,8)，遍历过后发现[0,4)范围内的整数个数为5，于是调整为搜索[0,4)范围内的整数。第二次发现[2, 4)范围内的证书为3，大于2，于是调整为[2, 4)。再经过第三次的遍历，找出3为重复出现的整数。因为是没有排序的数组，所以肯定只有每次都遍历完整个数组所以这个的时间复杂度就是O(nlog(2)n)。

方法3

因为上面的方法在最坏的情况下时间复杂度是O(nlog(2)n)。所以改进方法，不用考虑过多的重复元素，可……以把运行时间缩短为线性时间。如果知道了当前数值范围内的m个整数中一定有重复元素，并不是把原有文件里这个范围内的整数写到新的文件里去”，而是“把原有文件里这个范围内的整数选取前m+1（m=n/2,n/4...）个写到新的文件里”即可。然后下一次的二分搜索在这个新的文件夹中进行。这样就保证了在数值表示范围减半的同时，搜索的元素的个数也同时减半了。这既可至少找到一个重复元素，也可满足等比数列的要求，需要搜索的元素的个数依次为n,n/2,n/4……根据等比数列的计算方法得到2n-1,所以这种方法的时间复杂度是O（2n-1）。之所以能够有这种改进的方法就因为输入是排序了的。

3、两个向量的转置算法，i,n的最大公约数怎么出现在程序中。

参考：http://www.cnblogs.com/yjf512/archive/2010/11/16/1878146.html

i,n的最大公约数其实就是从头开始进行a[i]=a[2i] a[2i]=a[3i]的次数

待移动的数组假设为a，长度为len，需要移动rotate位，编程珠玑上说的：用的时候，务必小心！书中给的是len =12，rotate=3，是整数倍的关系，直接可以循环3次实现移位，但是这是特殊情况，对于任意情况，应该考虑不是整数倍的时候怎么移动，举个例子：

数组0~11，一个12个数，这个比较有代表性，可以移动4,5,8次来满足各种情况，
1）对于4次，是12的的整数倍，就像书中写的那样，循环4次就可以完成，每次都刚好移完整个串，代码是这样的：

 1         for (int i = 0; i < 4; i++) {
 2             temp = a[i];
 3             before = i;
 4             while (true) {
 5                 next = (before + rotate) % len;
 6                 if (next == i) {
 7                     break;
 8                 } else {
 9                     a[before] = a[next];
10                     before = next;
11                 }
12             }
13             a[before] = temp;
14         }

每次取到等于i的时候，就从temp里取出该轮的第一个值，这是个循环，跳出，进入下一轮；
2）当移动5位的时候，不是12的整数倍，这时，会一直循环，只有到最后一个数的移动，才会使next值等于i，因为next怎么加rotate，都不会是len的整数倍，

这时，整个循环只要1次就行了，会一直在while里循环，直到最后取出temp值才会跳出，这时已经移位结束了。则这部分代码就是上面的4-->1；

4、三个旋转向量算法

[cpp]view plaincopy 
   
 #include <stdio.h>  
 #include <stdlib.h>  
 #include <time.h>  
 #include <windows.h>  
   
 void reverse1(char c[], int i, int n)  
 {  
     int p = 0;  
     int count = 0;  
     if(i > 0 && n>=i)  
     {  
         while(count!=n)  
         {  
             int t = c[p];  
             int q = p + i;  
             while((q%n)!=p)  
             {  
                 c[(q-i)%n] = c[q%n];  
                 count++;  
                 q+=i;  
             }  
             c[(q-i)%n] = t;  
             count++;  
             p++;  
         }  
           
     }  
     //p为i,n最大公约数，即从第一个数开始进行c[i]=c[2i]  c[2i]=c[3i]循环的次数  
     printf("%d",p);  
 }  
 void reverse2(char c[], int i, int j)  
 {  
     char p;  
     while(i<j)  
     {  
         p = c[i];  
         c[i] = c[j];  
         c[j] = p;  
         i++;  
         j--;  
     }  
 }  
 int main()  
 {  
     int i = 0;  
     char c[] ={'a','b','c','d','e','f','g','h'};  
     DWORD start, stop;  
     start = GetTickCount();  
     reverse1(c,3,8);  
     stop = GetTickCount();  
     printf("time: %lld ms\n", stop - start);  
     for(i = 0; i < 8;i++)  
     {  
         printf("%c",c[i]);  
     }  
     printf("%c",'\n');  
     char d[] ={'a','b','c','d','e','f','g','h'};  
     start = GetTickCount();  
     reverse2(d,0,2);  
     reverse2(d,3,7);  
     reverse2(d,0,7);  
     stop = GetTickCount();  
     printf("time: %lld ms\n", stop - start);  
     for(i = 0; i < 8;i++)  
     {  
         printf("%c",d[i]);  
     }  
     printf("%c",'\n');  
     return 1;  
 }