大数据查重-位图算法 位: 内存管理的最小单位是字节,一个字节是8个位。 问题: 有1亿个整数,最大值不超过1亿,问都有哪些元素重复了?谁是第一个重复的? 内存限制100M 1亿 = 100M 如果是放到哈希表上:100M * 4 = 400M * 2 = 800M 1、什么是位图算法? 我们有下面一行数字: