hf-simdex:通过hash值找出重复的chunk 格式: ./hf-simdex [-i indexing_method] [-s hash] hash_files 参数: indexing_method的有效参数共两个:rbtree(默认)和list rbtree:给出hashfile中的file、chunk、byte总数及重复的chunk、byte数 list:会输出处理过程,其效果与rbtree相同,但速度与rbtree相比堪称龟速。 -s参数:将指定hash值的chunk忽略: 上图可以看出chunk和byte的数量减少了