编程珠玑（第二版）读书笔记【1、2】

最新推荐文章于 2020-12-30 22:16:33 发布

visayan

最新推荐文章于 2020-12-30 22:16:33 发布

阅读量560

点赞数

分类专栏：算法文章标签：算法

算法专栏收录该内容

8 篇文章 0 订阅

订阅专栏

第一章

问题：

一个文件F，包含最多1000万条无序的、不重复的记录，每条记录都是一个7位的十进制正整数，利用1MB左右的内存空间，按照整数的大小对文件进行升序排序，将结果保存到文件FO中。

分析：

1MB内存，共有1024*1024*8=8388608bit，如果每个正整数采用32位二进制存储，可以存放1024*1024*8/32=262144条记录。一个7位十进制正整数在[1,10000000)之间。

解决方案1：

使用基于临时文件的归并排序，大致的方法如下：

第一次从F中读取前250000条记录，在内存中用快速排序进行排序，输出到一个临时文件TmpF0中，之后以此类推，每次从F中读取250000条记录，排序后存入临时文件TmpFi中。

最后，将临时文件TmpF0-TmpF39，这40个临时文件进行归并，存入FO。

解决方案2：

40趟读取F，方法大致如下：

分40趟，第一趟从F中找出数值在0-249999之间的记录，放入内存，用快速排序进行排序，然后保存到输出文件FO中。这样就省去了临时文件，但需要从头到尾将输入文件F读取40次。

解决方案3：

位图法，方法大致如下：

由于记录的数值不超过1000万，可以用1000万个bit来标记一个整数是否存在，这样需要1.192MB的内存空间就可以标记所有的7位正整数。先将这1000万个bit全部置零，然后对F扫描，如果一个数值存在，则将对应的位置1，最后将对应位为1的数值按照升序写入文件FO。

第二章

第二章中解决了三个小问题;

A、找出顺序文件中缺失的记录。用的是二分查找的方法。

B、在正比于n的时间内将一个n元一维向量循环左移i个位置(i < n)。

此问题解决方法是将向量中0到i-1号元素翻转，再将i到n-1号元素翻转，最后将整个向量翻转，即：

Reverse(0, i-1);

Reverse(I, n-1);

Reverse(0, n-1);

C、找出英语词典中所有变位词的集合。变位词就是例如pots、stop、tops这样的单词。

此问题解决方法是给词典中的每一个单词做标识，比如将每个单词中的字母按字典序排列后作为该单词的标识，然后所有单词按照标识排序，最后去掉重复的标识。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。