Python 之 hashlib 与 hmac 模块的基本使用及原理(52)

最新推荐文章于 2025-05-06 23:38:51 发布

Android 小码蜂

最新推荐文章于 2025-05-06 23:38:51 发布

阅读量519

点赞数 28

分类专栏： Python入门介绍文章标签： python 开发语言

本文链接：https://blog.csdn.net/qq_28540861/article/details/147689105

版权

Python入门介绍专栏收录该内容

69 篇文章

订阅专栏

Python 之 hashlib 与 hmac 模块的基本使用及原理

一、引言

在信息安全领域，数据的完整性和真实性是至关重要的。哈希函数和消息认证码（MAC）是保障数据安全的重要工具。Python 的 hashlib 和 hmac 模块分别提供了对哈希函数和基于哈希的消息认证码的支持。hashlib 模块允许开发者使用多种常见的哈希算法对数据进行哈希处理，而 hmac 模块则基于 hashlib 实现了消息认证码的生成和验证。本文将深入探讨这两个模块的基本使用方法以及背后的工作原理。

二、hashlib 模块

2.1 模块概述

hashlib 是 Python 标准库中的一个模块，它提供了对多种常见哈希算法的支持，如 MD5、SHA-1、SHA-256 等。哈希算法是一种单向函数，它将任意长度的输入数据转换为固定长度的哈希值。哈希值具有唯一性和确定性，即相同的输入数据总是会产生相同的哈希值，而不同的输入数据产生相同哈希值的概率极低（哈希碰撞）。哈希函数常用于数据完整性验证、密码存储等场景。

2.2 导入模块

在使用 hashlib 模块之前，需要先将其导入到 Python 脚本中。可以使用以下代码完成导入：

import hashlib  # 导入 hashlib 模块，用于后续的哈希操作

2.3 常见哈希算法的使用

2.3.1 MD5 算法

MD5 是一种广泛使用的哈希算法，它产生 128 位（16 字节）的哈希值。以下是一个使用 MD5 算法计算字符串哈希值的示例：

import hashlib

# 要进行哈希处理的字符串
data = "Hello, World!"
# 创建一个 MD5 哈希对象
md5_hash = hashlib.md5()
# 将字符串编码为字节类型，并更新哈希对象
md5_hash.update(data.encode('utf-8'))
# 获取计算得到的哈希值，以十六进制字符串形式表示
md5_digest = md5_hash.hexdigest()
print(f"MD5 哈希值: {md5_digest}")

在上述代码中，首先创建了一个 md5 哈希对象，然后使用 update() 方法将字符串编码后的字节数据更新到哈希对象中，最后使用 hexdigest() 方法获取十六进制形式的哈希值。

2.3.2 SHA-1 算法

SHA-1 是另一种常见的哈希算法，它产生 160 位（20 字节）的哈希值。以下是一个使用 SHA-1 算法计算字符串哈希值的示例：

import hashlib

# 要进行哈希处理的字符串
data = "Hello, World!"
# 创建一个 SHA-1 哈希对象
sha1_hash = hashlib.sha1()
# 将字符串编码为字节类型，并更新哈希对象
sha1_hash.update(data.encode('utf-8'))
# 获取计算得到的哈希值，以十六进制字符串形式表示
sha1_digest = sha1_hash.hexdigest()
print(f"SHA-1 哈希值: {sha1_digest}")

代码的逻辑与 MD5 示例类似，只是创建的是 sha1 哈希对象。

2.3.3 SHA-256 算法

SHA-256 是 SHA-2 系列算法中的一种，它产生 256 位（32 字节）的哈希值，安全性较高。以下是一个使用 SHA-256 算法计算字符串哈希值的示例：

import hashlib

# 要进行哈希处理的字符串
data = "Hello, World!"
# 创建一个 SHA-256 哈希对象
sha256_hash = hashlib.sha256()
# 将字符串编码为字节类型，并更新哈希对象
sha256_hash.update(data.encode('utf-8'))
# 获取计算得到的哈希值，以十六进制字符串形式表示
sha256_digest = sha256_hash.hexdigest()
print(f"SHA-256 哈希值: {sha256_digest}")

同样，创建 sha256 哈希对象并进行相应操作。

2.4 处理大文件的哈希计算

对于大文件，不能一次性将整个文件内容加载到内存中进行哈希计算，需要分块读取文件内容并逐步更新哈希对象。以下是一个计算大文件 SHA-256 哈希值的示例：

import hashlib

# 要计算哈希值的文件路径
file_path = 'large_file.txt'
# 创建一个 SHA-256 哈希对象
sha256_hash = hashlib.sha256()

try:
    # 以二进制只读模式打开文件
    with open(file_path, 'rb') as file:
        # 分块读取文件内容，每次读取 4096 字节
        for chunk in iter(lambda: file.read(4096), b""):
            # 更新哈希对象
            sha256_hash.update(chunk)
    # 获取计算得到的哈希值，以十六进制字符串形式表示
    sha256_digest = sha256_hash.hexdigest()
    print(f"文件 {file_path} 的 SHA-256 哈希值: {sha256_digest}")
except FileNotFoundError:
    print(f"文件 {file_path} 未找到。")

在上述代码中，使用 iter() 函数和 lambda 表达式实现分块读取文件内容，每次读取 4096 字节并更新哈希对象，最后获取哈希值。

2.5 hashlib 模块的原理

hashlib 模块的核心原理是基于不同的哈希算法实现。每个哈希算法都有其特定的数学运算和处理步骤。当创建一个哈希对象时，hashlib 会初始化该算法所需的内部状态。在调用 update() 方法时，会将输入的数据与当前的内部状态进行特定的运算，更新内部状态。最后，调用 hexdigest() 或 digest() 方法时，会根据最终的内部状态生成哈希值。不同的哈希算法在安全性、哈希值长度和计算性能等方面存在差异。例如，MD5 算法由于存在哈希碰撞的风险，已经逐渐不被推荐用于安全敏感的场景，而 SHA-256 等算法具有更高的安全性。

三、hmac 模块

3.1 模块概述

hmac 模块实现了基于哈希的消息认证码（HMAC）。消息认证码是一种用于验证消息完整性和真实性的机制，它结合了密钥和哈希函数。HMAC 通过使用一个密钥和输入消息，经过特定的计算过程生成一个固定长度的消息认证码。只有拥有相同密钥的接收方才能验证消息的完整性和真实性。hmac 模块基于 hashlib 提供的哈希算法实现了 HMAC 的生成和验证功能。

3.2 导入模块

在使用 hmac 模块之前，需要先将其导入到 Python 脚本中。可以使用以下代码完成导入：

import hmac  # 导入 hmac 模块，用于后续的消息认证码操作

3.3 生成 HMAC

以下是一个使用 hmac 模块生成 HMAC 的示例，使用 SHA-256 算法：

import hmac
import hashlib

# 密钥，必须是字节类型
key = b'secret_key'
# 要进行 HMAC 计算的消息
message = b'Hello, World!'
# 创建一个 HMAC 对象，使用 SHA-256 算法和指定的密钥
hmac_obj = hmac.new(key, message, digestmod=hashlib.sha256)
# 获取计算得到的 HMAC 值，以十六进制字符串形式表示
hmac_digest = hmac_obj.hexdigest()
print(f"HMAC (SHA-256) 值: {hmac_digest}")

在上述代码中，使用 hmac.new() 函数创建一个 HMAC 对象，指定密钥、消息和哈希算法（这里使用 SHA-256），然后使用 hexdigest() 方法获取十六进制形式的 HMAC 值。

3.4 验证 HMAC

接收方在接收到消息和 HMAC 值后，可以使用相同的密钥和哈希算法重新计算 HMAC 值，并与接收到的 HMAC 值进行比较，以验证消息的完整性和真实性。以下是一个验证 HMAC 的示例：

import hmac
import hashlib

# 密钥，必须是字节类型
key = b'secret_key'
# 接收到的消息
received_message = b'Hello, World!'
# 接收到的 HMAC 值，以十六进制字符串形式表示
received_hmac_digest = '3d9f6c8a8d8d8d8d8d8d8d8d8d8d8d8d8d8d8d8d8d8d8d8d8d8d8d8d8d8d8d8d'
# 创建一个 HMAC 对象，使用 SHA-256 算法和指定的密钥，重新计算 HMAC 值
hmac_obj = hmac.new(key, received_message, digestmod=hashlib.sha256)
# 获取重新计算得到的 HMAC 值，以十六进制字符串形式表示
computed_hmac_digest = hmac_obj.hexdigest()

# 比较接收到的 HMAC 值和重新计算得到的 HMAC 值
if hmac.compare_digest(received_hmac_digest, computed_hmac_digest):
    print("HMAC 验证通过，消息完整且真实。")
else:
    print("HMAC 验证失败，消息可能被篡改或不真实。")

在上述代码中，使用 hmac.compare_digest() 函数比较接收到的 HMAC 值和重新计算得到的 HMAC 值，该函数可以防止时间攻击，提高验证的安全性。

3.5 hmac 模块的原理

hmac 模块的原理基于 HMAC 算法的定义。HMAC 算法结合了密钥和哈希函数，通过特定的步骤计算消息认证码。具体来说，HMAC 算法将密钥与输入消息进行一系列的异或、哈希运算等操作。首先，将密钥进行处理，使其长度符合哈希算法的要求。然后，将处理后的密钥与内部填充字节和外部填充字节分别进行异或操作，得到内部密钥和外部密钥。接着，将内部密钥与输入消息进行拼接，并进行哈希运算，得到中间结果。最后，将外部密钥与中间结果进行拼接，并再次进行哈希运算，得到最终的 HMAC 值。通过这种方式，HMAC 算法利用哈希函数的特性，结合密钥，实现了消息的完整性和真实性验证。

四、总结与展望

4.1 总结

Python 的 hashlib 和 hmac 模块为开发者提供了方便、高效的哈希处理和消息认证码生成验证功能。hashlib 模块支持多种常见的哈希算法，可用于数据完整性验证、密码存储等场景。hmac 模块基于 hashlib 实现了消息认证码的生成和验证，通过结合密钥和哈希函数，保障了消息的完整性和真实性。这两个模块在信息安全领域有着广泛的应用，能够帮助开发者构建更安全的应用程序。