32位RAM处理器中,int代表4个字节,具有32位,它的范围是-2147483648~2147483647的整数。
若想对全范围整数进行查重,即对于任意数量任意大小的int变量I,判断I是否出现在已知的数组中。若通过整数数组int[]来表示全范围的整数,那么数组的长度为2^32。这样会使普通PC机器的内存溢出。考虑到任意int是由32位组成的,即如果能使每一int与32位形成唯一且互不重复的映射即可。故建立字节数组byte[] B。1 int = 8 bit,那么B的长度为2^29的长度,300MB的内存开销即可满足。
int[] 与byte[] 对应关系的建立:
假设int 的大小I 整除8 得到的整数a,余数为b。a 为I 在byte[]中的byte[a]上,b 为I 在byte[a] 的8个整数的b位上。
byte[]刚建立时所有数据为0, 将输入整数的得到的a, b 的值。将byte[a] 的b 位改为1 即可。
byte[a] 的b 位数字修改方法:
假设byte[a]=32。将它转换为二进制并补全8 位可得00100000。当b的4 时,即00101000为原始数组中存在目标数,重复。00100000 表示非重复。即将b代表的位数取出判断0、1即可。
这样可以在遍历一遍目标数组的情况下完成查重,也便于在普通PC机器上实现算法。