1.基本概念
分片哈希是使用任意的哈希算法对一个文件产生多个校验和而不是对一个文件产生一个校验和。
它将一个文件进行切片,将文件分成固定的大小,然后计算每一个切片的哈希值。例如,第一个hash是由前512个字节构成的,第二个哈希值是由后面的另外的512个字节构成的。
这个技术最先被用到在图像的取证上的。如果一个错误发生了,只有一个分段hash会受到影响,对于剩下的数据仍然能保持其正确性。
分段hash可以使用加密哈希例如MD5或者传统的FNV哈希算法。
=========================================================
对于分段hash,我们要做的事情首先就是删除文本中的无用字符,对文本每个片段进行切片,计算它们的hash值。
2.删除文本中不需要的字符
解决方案
strip() 方法能用于删除开始和结尾的字符。
现在我们要从文件中读取多行数据。我们可以使用strip操作和其他迭代操作相结合。
代码如下: