分片哈希piecewise hashing

本文介绍了分片哈希的概念,它通过将文件切片并计算每个切片的哈希值来提高数据校验的准确性。在Python中,通过strip()方法去除文本中的无用字符,并使用hashlib库计算MD5哈希值,以此实现对文件内容的分片哈希处理。
摘要由CSDN通过智能技术生成

1.基本概念

分片哈希是使用任意的哈希算法对一个文件产生多个校验和而不是对一个文件产生一个校验和。

它将一个文件进行切片,将文件分成固定的大小,然后计算每一个切片的哈希值。例如,第一个hash是由前512个字节构成的,第二个哈希值是由后面的另外的512个字节构成的。

这个技术最先被用到在图像的取证上的。如果一个错误发生了,只有一个分段hash会受到影响,对于剩下的数据仍然能保持其正确性。

分段hash可以使用加密哈希例如MD5或者传统的FNV哈希算法。

=========================================================

对于分段hash,我们要做的事情首先就是删除文本中的无用字符,对文本每个片段进行切片,计算它们的hash值。


2.删除文本中不需要的字符

解决方案
strip() 方法能用于删除开始和结尾的字符。
现在我们要从文件中读取多行数据。我们可以使用strip操作和其他迭代操作相结合。

代码如下:


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值