将一堆文件中,相同内容的文件分为一组
通过字符串匹配速度太慢,首先应该想到的是将文件内容编码,譬如取其md5,或者其hash值,然后用map, 将md5相同的文件放在相同的key下
还有一个小优化的地方,就是先通过文件的size大体的分类
将一堆文件中,相同内容的文件分为一组
通过字符串匹配速度太慢,首先应该想到的是将文件内容编码,譬如取其md5,或者其hash值,然后用map, 将md5相同的文件放在相同的key下
还有一个小优化的地方,就是先通过文件的size大体的分类