2个特别大的文件A和文件B,求交集 文件中存放的是url,2个文件都无法直接读到内存。 思路 hash+分片 1.将文件A中的hash(url)%100,生成100个小文件。 2.文件B中也hash(url)%100,生成100个小文件。 3.然后将A子文件001和B子文件001求交集,放入一个结果文件即可。