看这本书时,心里默默告诉自己,要好好琢磨,不可求速度,要看自己吸收了多少。
现在把第一章总结下:
当遇到一个问题时,解决的一般原理为:
第一:正确的问题。明确问题,这场战役就成功了90%。对问题进行形式化的描述是很关键的,把输入、输出和约束亲手写下来。
输入:一个最多包含n个正整数的文件,每个数都小于n,其中n=10^7。如果在输入文件中有任何整数重复出现就是致命错误。没有其他数据和该整数相关联。
输出:按升序排列的输入整数的列表
约束:最多有(大约)1MB的内存空间可用,有充足的磁盘存储空间可用。运行时间最多几分钟,运行时间为10秒就不需要进一步优化了。
第二:程序设计。该问题用到位图数据结构。
位图 或位向量图 作为一个集合, 表示的这样的一个数据结构:
用字符串 0 1 1 1 0 1 0 0 1 0 0 0 0 1 0 0 0 0 0 0 表示集合 {1,2,3,5,8,13}.位图 或位向量图 作为一个集合, 表示的这样的一个数据结构:
int a[10000000],a[i]只保留了一个整型值0或1,如果我们把每一个元素包含的内容扩充,使之保留尽可能多的号码是否存在的信息,那么数组范围会得到明显的下降。
事实上,我们是用每一个元素表示一个32位的二进制字符串这样这个元素可以保留相邻32个号码是否存在的信息,数组范围就下降到了10000000/32了,例如对于号码89256,由于89256 mod 32=2789…8,这样我们应该 置a[2789]中32位字符串的第8位(从低位数起)为1现在问题的关键是,如何用位逻辑运算来表示这种操作。
#define BITSPERWORD 32
#define MASK SHIFT 5 //移动5个位,左移相当于乘以32,右移相当于除以32取整
#define MASK 0x1F //十六进制下的31
#define N 10000000
// 置位函数----用“|”操作符,I & MASK相当于mod操作
//m mod n 运算,当n = 2 的X次幂的时候,m mod n = m & (n-1)
void set(int i)
{
a[i>>SHIFT] |= (1<<(i & MASK));
}
//清除位操作民用&~操作符
void clr (int i)
{
a[i>>SHIFT] &= ~(1<<(I & MASK))
}
//测试位操作用&操作符
int test(int i) {return a[i>>SHIFT] & (1<<(i&MASK))}