MD5算法的C++实现

MD5算法的C++实现

1. Introduction
MD5算法是一种消息摘要算法( Message Digest Algorithm),此算法以任意长度的信息(message)作为输入进行计算,产生一个128-bit(16-byte)的指纹或报文摘要( fingerprint or message digest)。两个不同的message产生相同message digest的几率相当小,从一个给定的message digest逆向产生原始message更是困难(不过据说我国的某个教授很善于从message digest构造message),因此MD5算法适合用在数字签名应用中。MD5实现简单,在32位的机器上运行速度也相当快,当然实际应用也不仅仅局限于数字签名。

2. MD5 Algorithm Description
假设输入信息(input message)的长度为b(bit),我们想要产生它的报文摘要,在此处b为任意的非负整数:b也可能为0,也不一定为8的整数倍,且可能是任意大的长度。设该信息的比特流表示如下:

          M[0] M[1] M[2] ... M[b-1]

计算此信息的报文摘要需要如下5步:
2.1 Append Padding Bits
信息计算前先要进行位补位,设补位后信息的长度为LEN(bit),则LEN%512 = 448(bit),即数据扩展至
K*512+448(bit)。即K*64+56(byte),K为整数。补位操作始终要执行,即使补位前信息的长度对512求余的结果是448。具体补位操作:补一个1,然后补0至满足上述要求。总共最少要补1bit,最多补512bit。

2.2 Append Length
将输入信息的原始长度b(bit)表示成一个64-bit的数字,把它添加到上一步的结果后面(在32位的机器上,这64位将用2个字来表示并且低位在前)。当遇到b大于2^64这种极少的情况时,b的高位被截去,仅使用b的低64位。经过上面两步,数据就被填补成长度为512(bit)的倍数。也就是说,此时的数据长度是16个字(32bit)的整数倍。此时的数据表示为:

          M[0 ... N-1]

其中的N是16的倍数。

2.3 Initialize MD Buffer
用一个四个字的缓冲器(A,B,C,D)来计算报文摘要,A,B,C,D分别是32位的寄存器,初始化使用的是十六进制表示的数字,注意低字节在前:

        word A: 01 23 45 67
        word B: 89 ab cd ef
        word C: fe dc ba 98
        word D: 76 54 32 10


2.4 Process Message in 16-Word Blocks
首先定义4个辅助函数,每个函数的输入是三个32位的字,输出是一个32位的字:

        F(X,Y,Z) = XY v not(X) Z
        G(X,Y,Z) = XZ v Y not(Z)
        H(X,Y,Z) = X xor Y xor Z
        I(X,Y,Z) = Y xor (X v not(Z))

NOTE:not(X)代表X的按位补运算,X v Y 表示X和Y的按位或运算,X xor Y代表X和Y的按位异或运算,XY代表X和Y的按位与运算。

具体过程如下:
 1 /* Process each 16-word block. */
 2    For i = 0 to N/16-1 do
 3 
 4      /* Copy block i into X. */
 5      For j = 0 to 15 do
 6        Set X[j] to M[i*16+ j].
 7      end /* of loop on j */

 8 
 9      /* Save A as AA, B as BB, C as CC, and D as DD. */
10      AA =  A
11      BB =
 B
12      CC =
 C
13      DD =
 D
14 

15      /* Round 1. */
16      /*  Let [abcd k s i] denote the operation
17           a = b + ((a + F(b,c,d) + X[k] + T[i]) <<< s). */

18      /* Do the following 16 operations. */
19      [ABCD  0  7  1]  [DABC  1 12  2]  [CDAB  2 17  3]  [BCDA  3 22  4 ]
20      [ABCD  4  7  5]  [DABC  5 12  6]  [CDAB  6 17  7]  [BCDA  7 22  8
]
21      [ABCD  8  7  9]  [DABC  9 12 10]  [CDAB 10 17 11]  [BCDA 11 22 12
]
22      [ABCD 12  7 13]  [DABC 13 12 14]  [CDAB 14 17 15]  [BCDA 15 22 16
]
23 

24      /* Round 2. */
25      /*  Let [abcd k s i] denote the operation
26           a = b + ((a + G(b,c,d) + X[k] + T[i]) <<< s). */

27      /* Do the following 16 operations. */
28      [ABCD  1  5 17]  [DABC  6  9 18]  [CDAB 11 14 19]  [BCDA  0 20 20 ]
29      [ABCD  5  5 21]  [DABC 10  9 22]  [CDAB 15 14 23]  [BCDA  4 20 24
]
30      [ABCD  9  5 25]  [DABC 14  9 26]  [CDAB  3 14 27]  [BCDA  8 20 28
]
31      [ABCD 13  5 29]  [DABC  2  9 30]  [CDAB  7 14 31]  [BCDA 12 20 32
]
32 

33      /* Round 3. */
34      /*  Let [abcd k s t] denote the operation
35           a = b + ((a + H(b,c,d) + X[k] + T[i]) <<< s). */

36      /* Do the following 16 operations. */
37      [ABCD  5  4 33]  [DABC  8 11 34]  [CDAB 11 16 35]  [BCDA 14 23 36 ]
38      [ABCD  1  4 37]  [DABC  4 11 38]  [CDAB  7 16 39]  [BCDA 10 23 40
]
39      [ABCD 13  4 41]  [DABC  0 11 42]  [CDAB  3 16 43]  [BCDA  6 23 44
]
40      [ABCD  9  4 45]  [DABC 12 11 46]  [CDAB 15 16 47]  [BCDA  2 23 48
]
41 

42      /* Round 4. */
43      /*  Let [abcd k s t] denote the operation
44           a = b + ((a + I(b,c,d) + X[k] + T[i]) <<< s). */

45      /* Do the following 16 operations. */
46      [ABCD  0  6 49]  [DABC  7 10 50]  [CDAB 14 15 51]  [BCDA  5 21 52 ]
47      [ABCD 12  6 53]  [DABC  3 10 54]  [CDAB 10 15 55]  [BCDA  1 21 56
]
48      [ABCD  8  6 57]  [DABC 15 10 58]  [CDAB  6 15 59]  [BCDA 13 21 60
]
49      [ABCD  4  6 61]  [DABC 11 10 62]  [CDAB  2 15 63]  [BCDA  9 21 64
]
50 

51      /*  Then perform the following additions. (That is increment each
52 
        of the four registers by the value it had before this block
53         was started.) */

54      A = A +  AA
55      B = B +
 BB
56      C = C +
 CC
57      D = D +
 DD
58 

59    end /* of loop on i */

2.5 Output
报文摘要的产生后的形式为:A,B,C,D。也就是低位字节A开始,高位字节D结束。

3. C++ Implementation
有了上面5个步骤的算法描述,用C++实现起来就很直接了。需要注意的是在具体实现的时候上述5个步骤的顺序会有所变动,因为在大多数情况下我们都无法或很难提前计算出输入信息的长度b(如输入信息来自文件或网络)。因此在具体实现时 Append Padding BitsAppend Length这两步会放在最后面。

4. Test Suite
由于实现代码比较长,在这里就不贴出来了,在本文后面会提供下载。MD5类的public接口如下:
md5.h
 1 class  MD5 {
 2 public
:
 3 
    MD5();
 4     MD5(const void *
input, size_t length);
 5     MD5(const string &
str);
 6     MD5(ifstream &
in);
 7     void update(const void *
input, size_t length);
 8     void update(const string &
str);
 9     void update(ifstream &
in);
10     const byte*
 digest();
11 
    string toString();
12     void
 reset();
13 
    ...
14 };

下面简单介绍一下具体用法:
1.计算字符串的MD5值
下面的代码计算字符串"abc"的MD5值并用cout输出:
1  MD5 md5;
2 md5.update("abc"
);
3 cout << md5.toString() <<
 endl;
4 //或者更简单点

5 cout << MD5("abc").toString() << endl;

2.计算文件的MD5值
下面的代码计算文本文件"D:/test.txt"的MD5值并用cout输出,如果是二进制文件打开的时候记得要指定ios::binary模式。另外需要注意的是用来计算的文件必须存在,所以最好在计算前先判断下ifstream的状态。
(本来判断ifstream是否有效不该是客户的责任,原本想在ifstream无效时用文件名做参数抛出FileNotFoundException之类的异常,后来却发现从ifstream中居然无法得到文件名...)
1  MD5 md5;
2 md5.update(ifstream("D://test.txt"
));
3 cout << md5.toString() <<
 endl;
4 //或者更简单点

5 cout << MD5(ifstream("D://test.txt")).toString() << endl;

3.最基本的用法
上面的用来计算字符串和文件MD5值的接口都是为了方便才提供的,其实最基本的接口是:
void update(const void *input, size_t length);
update的另外两个重载都是基于它来实现的,下面的代码用上述接口来实现FileDigest函数,该函数用来计算文件的MD5值:
 1 string FileDigest(const string & file) {
 2 

 3      ifstream in(file.c_str(), ios::binary);
 4     if (!
in)
 5         return ""
;
 6 

 7      MD5 md5;
 8 
    std::streamsize length;
 9     char buffer[1024
];
10     while (!
in.eof()) {
11         in.read(buffer, 1024
);
12         length =
 in.gcount();
13         if (length > 0
)
14 
            md5.update(buffer, length);
15 
    }
16 
    in.close();
17     return
 md5.toString();
18 }

下面看看测试代码:
test.cpp
 1 #include "md5.h"
 2 #include <iostream>
 3 
 4  using namespace std;
 5 

 6 void PrintMD5(const string &str, MD5 & md5) {
 7     cout << "MD5(/"" << str << "/") = " << md5.toString() <<
 endl;
 8 
}
 9 

10 int  main() {
11 

12      MD5 md5;
13     md5.update(""
);
14     PrintMD5(""
, md5);
15 

16     md5.update("a" );
17     PrintMD5("a"
, md5);
18 

19     md5.update("bc" );
20     PrintMD5("abc"
, md5);
21 

22     md5.update("defghijklmnopqrstuvwxyz" );
23     PrintMD5("abcdefghijklmnopqrstuvwxyz"
, md5);
24 

25      md5.reset();
26     md5.update("message digest"
);
27     PrintMD5("message digest"
, md5);
28 

29      md5.reset();
30     md5.update(ifstream("D://test.txt"
));
31     PrintMD5("D://test.txt"
, md5);
32 

33     return 0 ;
34 }

测试结果:
MD5("") = d41d8cd98f00b204e9800998ecf8427e
MD5("a") = 0cc175b9c0f1b6a831c399e269772661
MD5("abc") = 900150983cd24fb0d6963f7d28e17f72
MD5("abcdefghijklmnopqrstuvwxyz") = c3fcd3d76192e4007dfb496cca67e13b
MD5("message digest") = f96b697d7cb7938d525a2f31aaf161d0
MD5("D:/test.txt") = 7ac66c0f148de9519b8bd264312c4d64


源代码下载: 点击下载
 
以下是一个使用C++实现MD5算法的例子: ```c++ #include <iostream> #include <cstring> #include <cstdio> #include <cstdlib> using namespace std; typedef unsigned int uint32; typedef unsigned char uint8; const uint32 kBlockSize = 64; class MD5 { public: MD5(); void Update(const void* data, size_t length); void Final(uint8* result); private: void Transform(const uint8 block[kBlockSize]); void Encode(uint8* output, const uint32* input, size_t length); void Decode(uint32* output, const uint8* input, size_t length); uint32 state_[4]; uint32 count_[2]; uint8 buffer_[kBlockSize]; }; MD5::MD5() { state_[0] = 0x67452301; state_[1] = 0xefcdab89; state_[2] = 0x98badcfe; state_[3] = 0x10325476; count_[0] = 0; count_[1] = 0; } void MD5::Update(const void* data, size_t length) { const uint8* input = static_cast<const uint8*>(data); uint32 buffer_size = count_[0] % kBlockSize; count_[0] += length; if (count_[0] < length) { count_[1]++; } count_[1] += length / kBlockSize; while (length > 0) { uint32 copy_size = min(length, kBlockSize - buffer_size); memcpy(buffer_ + buffer_size, input, copy_size); buffer_size += copy_size; input += copy_size; length -= copy_size; if (buffer_size == kBlockSize) { Transform(buffer_); buffer_size = 0; } } } void MD5::Final(uint8* result) { uint32 buffer_size = count_[0] % kBlockSize; buffer_[buffer_size++] = 0x80; if (buffer_size > kBlockSize - 8) { memset(buffer_ + buffer_size, 0, kBlockSize - buffer_size); Transform(buffer_); buffer_size = 0; } memset(buffer_ + buffer_size, 0, kBlockSize - buffer_size - 8); uint32 bit_count[2]; bit_count[0] = count_[0] << 3; bit_count[1] = (count_[1] << 3) | (count_[0] >> 29); uint32* bit_count_ptr = bit_count; Encode(buffer_ + kBlockSize - 8, bit_count_ptr, 2); Transform(buffer_); uint8* result_ptr = result; Encode(result_ptr, state_, 4); memset(this, 0, sizeof(*this)); } void MD5::Transform(const uint8 block[kBlockSize]) { static const uint32 k[64] = { 0xd76aa478, 0xe8c7b756, 0x242070db, 0xc1bdceee, 0xf57c0faf, 0x4787c62a, 0xa8304613, 0xfd469501, 0x698098d8, 0x8b44f7af, 0xffff5bb1, 0x895cd7be, 0x6b901122, 0xfd987193, 0xa679438e, 0x49b40821, 0xf61e2562, 0xc040b340, 0x265e5a51, 0xe9b6c7aa, 0xd62f105d, 0x02441453, 0xd8a1e681, 0xe7d3fbc8, 0x21e1cde6, 0xc33707d6, 0xf4d50d87, 0x455a14ed, 0xa9e3e905, 0xfcefa3f8, 0x676f02d9, 0x8d2a4c8a, 0xfffa3942, 0x8771f681, 0x6d9d6122, 0xfde5380c, 0xa4beea44, 0x4bdecfa9, 0xf6bb4b60, 0xbebfbc70, 0x289b7ec6, 0xeaa127fa, 0xd4ef3085, 0x04881d05, 0xd9d4d039, 0xe6db99e5, 0x1fa27cf8, 0xc4ac5665, 0xf4292244, 0x432aff97, 0xab9423a7, 0xfc93a039, 0x655b59c3, 0x8f0ccc92, 0xffeff47d, 0x85845dd1, 0x6fa87e4f, 0xfe2ce6e0, 0xa3014314, 0x4e0811a1, 0xf7537e82, 0xbd3af235, 0x2ad7d2bb, 0xeb86d391 }; uint32 a = state_[0]; uint32 b = state_[1]; uint32 c = state_[2]; uint32 d = state_[3]; uint32 x[16]; Decode(x, block, kBlockSize); a += ((b & c) | (~b & d)) + x[0] + k[0]; a = ((a << 7) | (a >> 25)) + b; d += ((a & b) | (~a & c)) + x[1] + k[1]; d = ((d << 12) | (d >> 20)) + a; c += ((d & a) | (~d & b)) + x[2] + k[2]; c = ((c << 17) | (c >> 15)) + d; b += ((c & d) | (~c & a)) + x[3] + k[3]; b = ((b << 22) | (b >> 10)) + c; a += ((b & c) | (~b & d)) + x[4] + k[4]; a = ((a << 7) | (a >> 25)) + b; d += ((a & b) | (~a & c)) + x[5] + k[5]; d = ((d << 12) | (d >> 20)) + a; c += ((d & a) | (~d & b)) + x[6] + k[6]; c = ((c << 17) | (c >> 15)) + d; b += ((c & d) | (~c & a)) + x[7] + k[7]; b = ((b << 22) | (b >> 10)) + c; a += ((b & c) | (~b & d)) + x[8] + k[8]; a = ((a << 7) | (a >> 25)) + b; d += ((a & b) | (~a & c)) + x[9] + k[9]; d = ((d << 12) | (d >> 20)) + a; c += ((d & a) | (~d & b)) + x[10] + k[10]; c = ((c << 17) | (c >> 15)) + d; b += ((c & d) | (~c & a)) + x[11] + k[11]; b = ((b << 22) | (b >> 10)) + c; a += ((b & c) | (~b & d)) + x[12] + k[12]; a = ((a << 7) | (a >> 25)) + b; d += ((a & b) | (~a & c)) + x[13] + k[13]; d = ((d << 12) | (d >> 20)) + a; c += ((d & a) | (~d & b)) + x[14] + k[14]; c = ((c << 17) | (c >> 15)) + d; b += ((c & d) | (~c & a)) + x[15] + k[15]; b = ((b << 22) | (b >> 10)) + c; a += ((b & d) | (c & ~d)) + x[1] + k[16]; a = ((a << 5) | (a >> 27)) + b; d += ((a & c) | (b & ~c)) + x[6] + k[17]; d = ((d << 9) | (d >> 23)) + a; c += ((d & b) | (a & ~b)) + x[11] + k[18]; c = ((c << 14) | (c >> 18)) + d; b += ((c & a) | (d & ~a)) + x[0] + k[19]; b = ((b << 20) | (b >> 12)) + c; a += ((b & d) | (c & ~d)) + x[5] + k[20]; a = ((a << 5) | (a >> 27)) + b; d += ((a & c) | (b & ~c)) + x[10] + k[21]; d = ((d << 9) | (d >> 23)) + a; c += ((d & b) | (a & ~b)) + x[15] + k[22]; c = ((c << 14) | (c >> 18)) + d; b += ((c & a) | (d & ~a)) + x[4] + k[23]; b = ((b << 20) | (b >> 12)) + c; a += ((b & d) | (c & ~d)) + x[9] + k[24]; a = ((a << 5) | (a >> 27)) + b; d += ((a & c) | (b & ~c)) + x[14] + k[25]; d = ((d << 9) | (d >> 23)) + a; c += ((d & b) | (a & ~b)) + x[3] + k[26]; c = ((c << 14) | (c >> 18)) + d; b += ((c & a) | (d & ~a)) + x[8] + k[27]; b = ((b << 20) | (b >> 12)) + c; a += ((b & d) | (c & ~d)) + x[13] + k[28]; a = ((a << 5) | (a >> 27)) + b; d += ((a & c) | (b & ~c)) + x[2] + k[29]; d = ((d << 9) | (d >> 23)) + a; c += ((d & b) | (a & ~b)) + x[7] + k[30]; c = ((c << 14) | (c >> 18)) + d; b += ((c & a) | (d & ~a)) + x[12] + k[31]; b = ((b << 20) | (b >> 12)) + c; a += (b ^ c ^ d) + x[5] + k[32]; a = ((a << 4) | (a >> 28)) + b; d += (a ^ b ^ c) + x[8] + k[33]; d = ((d << 11) | (d >> 21)) + a; c += (d ^ a ^ b) + x[11] + k[34]; c = ((c << 16) | (c >> 16)) + d; b += (c ^ d ^ a) + x[14] + k[35]; b = ((b << 23) | (b >> 9)) + c; a += (b ^ c ^ d) + x[1] + k[36]; a = ((a << 4) | (a >> 28)) + b; d += (a ^ b ^ c) + x[4] + k[37]; d = ((d << 11) | (d >> 21)) + a; c += (d ^ a ^ b) + x[7] + k[38]; c = ((c << 16) | (c >> 16)) + d; b += (c ^ d ^ a) + x[10] + k[39]; b = ((b << 23) | (b >> 9)) + c; a += (b ^ c ^ d) + x[13] + k[40]; a = ((a << 4) | (a >> 28)) + b; d += (a ^ b ^ c) + x[0] + k[41]; d = ((d << 11) | (d >> 21)) + a; c += (d ^ a ^ b) + x[3] + k[42]; c = ((c << 16) | (c >> 16)) + d; b += (c ^ d ^ a) + x[6] + k[43]; b = ((b << 23) | (b >> 9)) + c; a += (b ^ c ^ d) + x[9] + k[44]; a = ((a << 4) | (a >> 28)) + b; d += (a ^ b ^ c) + x[12] + k[45]; d = ((d << 11) | (d >> 21)) + a; c += (
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值