编程珠玑(第二版)读书笔记【1、2】

第一章

问题:

一个文件F,包含最多1000万条无序的、不重复的记录,每条记录都是一个7位的十进制正整数,利用1MB左右的内存空间,按照整数的大小对文件进行升序排序,将结果保存到文件FO中。

 

分析:

1MB内存,共有1024*1024*8=8388608bit,如果每个正整数采用32位二进制存储,可以存放1024*1024*8/32=262144条记录。一个7位十进制正整数在[1,10000000)之间。

 

解决方案1:

使用基于临时文件的归并排序,大致的方法如下:

第一次从F中读取前250000条记录,在内存中用快速排序进行排序,输出到一个临时文件TmpF0中,之后以此类推,每次从F中读取250000条记录,排序后存入临时文件TmpFi中。

最后,将临时文件TmpF0-TmpF39,这40个临时文件进行归并,存入FO。

 

解决方案2:

40趟读取F,方法大致如下:

分40趟,第一趟从F中找出数值在0-249999之间的记录,放入内存,用快速排序进行排序,然后保存到输出文件FO中。这样就省去了临时文件,但需要从头到尾将输入文件F读取40次。

 

解决方案3:

位图法,方法大致如下:

由于记录的数值不超过1000万,可以用1000万个bit来标记一个整数是否存在,这样需要1.192MB的内存空间就可以标记所有的7位正整数。先将这1000万个bit全部置零,然后对F扫描,如果一个数值存在,则将对应的位置1,最后将对应位为1的数值按照升序写入文件FO。

 

第二章

第二章中解决了三个小问题;

A、找出顺序文件中缺失的记录。用的是二分查找的方法。

B、在正比于n的时间内将一个n元一维向量循环左移i个位置(i < n)。

此问题解决方法是将向量中0到i-1号元素翻转,再将i到n-1号元素翻转,最后将整个向量翻转,即:

Reverse(0, i-1);

Reverse(I, n-1);

Reverse(0, n-1);

C、找出英语词典中所有变位词的集合。变位词就是例如pots、stop、tops这样的单词。

此问题解决方法是给词典中的每一个单词做标识,比如将每个单词中的字母按字典序排列后作为该单词的标识,然后所有单词按照标识排序,最后去掉重复的标识。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值