Python的hashlib提供了常见的摘要算法,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法。

摘要算法又称哈希算法、散列算法。它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。

以常见的摘要算法MD5为例,计算出一个字符串的MD5值:

import hashlib

MD5 = hashlib.md5()
MD5.update(bytes('how to use md5 in python hashlib?',encoding='utf-8'))
print(MD5.hexdigest())


d26a53750bc40b38b65a520292f69306

如果数据量很大,可以分块多次调用update(),最后计算的结果是一样的:

import hashlib

MD5 = hashlib.md5()
MD5.update(bytes('how to use md5 in ',encoding='utf-8'))
MD5.update(bytes('python hashlib?',encoding'utf-8'))
print(MD5.hexdigest())

改动一个字母,看看计算的结果是否完全不同。


MD5是最常见的摘要算法,速度很快,生成结果是固定的128 bit字节,通常用一个32位的16进制字符串表示。另一种常见的摘要算法是SHA1,调用SHA1和调用MD5完全类似:

import hashlib

SHA1 = hashlib.sha1()
SHA1.update(bytes('how to use sha1 in ',encoding='utf-8'))
SHA1.update(bytes('python hashlib?',encoding='utf-8'))
print(SHA1.hexdigest())

SHA1的结果是160 bit字节,通常用一个40位的16进制字符串表示。

比SHA1更安全的算法是SHA256和SHA512,不过越安全的算法不仅越慢,而且摘要长度更长。

以上加密算法虽然依然非常厉害,但时候存在缺陷,即:通过撞库可以反解。所以,有必要对加密算法中添加自定义key再来做加密。

import hashlib

hash = hashlib.md5(bytes('898oaFs09f',encoding="utf-8"))
hash.update(bytes('admin',encoding="utf-8"))
print(hash.hexdigest())


摘要算法应用

任何允许用户登录的网站都会存储用户登录的用户名和口令。如何存储用户名和口令呢?方法是存到数据库表中:

name    | password
--------+----------
michael | asddasda
lzj     | ddecewad
erics   | se232cw3

以明文保存用户口令,如果数据库泄露,所有用户的口令就落入***的手里;正确的保存口令的方式是不存储用户的明文口令,而是存储用户口令的摘要,比如MD5:

username | password
---------+---------------------------------
michael  | e10adc3949ba59abbe56e057f20f883e
lzj      | 878ef96e86145580c38c87f0410ad153
erics    | 99b1c2188db85afee403b1536010c2c9

当用户登录时,首先计算用户输入的明文口令的MD5,然后和数据库存储的MD5对比,如果一致,说明口令输入正确,如果不一致,口令肯定错误。