简介
MD5消息摘要算法一种被广泛使用的密码散列函数,输入长度小于264比特的消息,我的代码也是以小于264比特的消息为例,输出一个128位(16字节)的散列值 (hash value),输入信息以512比特的分组为单位处理。
算法流程
- 附加位填充
- 初始化链接变量
- 分组处理
- 步函数的运算
这个流程描述下来非常符合hash函数的一般模型:
单个点拿出来仔细分析
附加位填充
填充一个1和若干个0使消息长度模512与448同余,也就说剩余消息(此处的消息长度已经不满512位了)的最后512比特分组里面加上这一对填充的东西长度应该是448,还剩下64位是消息的长度,满足L mod 2^64,下图就很清楚解释了这一过程:
关键代码:
length = struct.pack('<Q', len(message)*8) #原消息长度64位比特的添加格式,太骚额这种写法
while len(message) > 64:
solve(message[:64])
message = message[64:]
#长度不足64位消息自行填充
message += '\x80'
message += '\x00' * (56 - len(message) % 64)
#print type(length)
message += length
solve(message[:64])
初始化链接变量
使用4个32位的寄存器A, B,C, D存放4个固定的32位整型参数,用于第一轮迭代,这里需要注意,书本上的值是直接给你的,但是没有倒过来,也就是大端和小端的转换问题。
#初始向量
A, B, C, D = (0x67452301, 0xefcdab89, 0x98badcfe, 0x10325476)
# A, B, C, D = (0x01234567, 0x89ABCDEF, 0xFEDCBA98, 0x76543210)
分组处理
与分组密码分组处理相似,有4轮步骤,将512比特的消息分组平均分为16个子分组,每个子分组有32比特,参与每一轮的的16步运算,每步输入是4个32比特的链接变量和一个32位的的消息子分组,经过这样的64步之后得到4个寄存器的值分别与输入的链接变量进行模加,关键代码如下,为了能够保存一下一开始A,B,C,D这四个初始变量的值,所以就先找四个变量把他们的值暂存一下,