如下图,在Python下载页面里,都会带有一个MD5哈希码。这是用来验证我们所下载的安装文件是否是原始文件的。当我们下载完文件后,先通过工具检查下所下载的文件的哈希码,跟下载页面中这个哈希码对比一下。数据相同代表所下载文件为原始文件,假如不同,那么你所下载文件被人篡改过了,那么安装就会有风险。
要计算MD5哈希值,我们可以使用Python的hashlib
库来计算。如:
"""
example085 - 获取文件的MD5哈希码的方法
Author: 不在同一频道上的呆子
Date: 2024/7/20
"""
import hashlib
def calculate_md5(file_path):
"""
计算并返回给定文件的MD5哈希值。
参数:
file_path (str): 要计算MD5的文件路径。
返回:
str: 文件的MD5哈希值。
"""
# 创建一个hash对象,使用md5算法
hash_md5 = hashlib.md5()
# 打开文件,准备读取
with open(file_path, "rb") as f:
# 分块读取文件内容,每块大小为4096字节
# 这样做是为了避免一次性将大文件加载到内存中
for byte_block in iter(lambda: f.read(4096), b""):
hash_md5.update(byte_block)
# 获取十六进制表示的哈希值
return hash_md5.hexdigest()
if __name__ == "__main__":
# 我的文件路径
mypath = r"C:\Users\admin\Downloads\python-3.12.4-amd64.exe"
md5_hash = calculate_md5(mypath)
print(f"The MD5 hash of {mypath} is: {md5_hash}")
除了MD5哈希码,现在有更安全的SHA-256哈希码。要计算SHA-256哈希码,用的也是Python标准库中的hashlib
模块。如:
import hashlib
def calculate_sha256(file_path):
"""
计算给定文件的SHA-256哈希值。
参数:
file_path (str): 要计算哈希值的文件的路径。
返回:
str: 文件的SHA-256哈希值。
"""
# 创建一个sha256 hash对象
hash_object = hashlib.sha256()
# 以二进制读模式打开文件
with open(file_path, "rb") as file:
# 分块读取文件并更新hash对象
for byte_block in iter(lambda: file.read(4096), b""):
hash_object.update(byte_block)
# 获取十六进制格式的哈希值
return hash_object.hexdigest()
if __name__ == "__main__":
# 输入文件路径
file_path = input("请输入文件的路径: ")
# 计算并打印文件的SHA-256哈希值
hash_value = calculate_sha256(file_path)
print(f"文件的SHA-256哈希值为: {hash_value}")
_value = calculate_sha256(file_path)
print(f"文件的SHA-256哈希值为: {hash_value}")