计算文件的MD5值
在数据传输过程中,可能会出现数据丢失、损坏或篡改的情况。为了确保数据传输的完整性,通常需要在发送方计算数据的MD5值,然后在接收方重新计算MD5值,比较两个MD5值是否一致,以确保数据的完整性和正确性。
hashlib是Python标准库中的一个包,用于提供加密哈希算法的实现。它支持多种哈希算法,包括MD5、SHA1、SHA224、SHA256、SHA384和SHA512等。哈希算法可以将任意长度的数据映射为固定长度哈希值。
import hashlib
def file_md5(file_path):
"""计算文件的 MD5 值"""
with open(file_path, "rb") as f:
md5 = hashlib.md5()
while True:
data = f.read(4096)
if not data:
break
md5.update(data)
return md5.hexdigest()
if __name__ == "__main__":
path1 = ''
path2 = ''
md5_1 = file_md5(path1)
md5_2 = file_md5(path2)
if md5_1 != md5_2:
print('两个文件不相同!!!')
值得一提的是,MD5算法已经不再是一种安全的哈希算法,因此在一些安全性要求较高的场景下,不建议使用MD5算法进行数据完整性校验和验证。更安全的哈希算法包括SHA256、SHA512等。