MD5算法深度解析与完整C语言实现

一、MD5算法概述

MD5(Message-Digest Algorithm 5)由Ronald Rivest于1992年设计,可生成128位(16字节)的哈希值。其核心设计基于Merkle-Damgård结构,包含以下关键阶段:

  1. 数据填充:将输入长度填充至512位的倍数
  2. 分块处理:以512位分组进行迭代计算
  3. 非线性函数:四轮共64步的位级运算
  4. 结果组合:输出四个32位寄存器的连接值

此博文主要是讲述在C语言中MD5的具体实现方法,在嵌入式系统中经常会用到此类的数据校验方式,例如在OTA过程中对于分段数据的校验。下面是正文,文末是完整的.h.c文件。

二、核心数据结构实现

2.1 MD5上下文结构体


typedef struct {
    unsigned long total[2];   // 64位消息长度计数器
    unsigned long state[4];   // 128位中间状态
    unsigned char buffer[64]; // 512位输入缓冲区
} md5_context;

结构体字段说明:

  • total[0]: 消息长度的低32位
  • total[1]: 消息长度的高32位
  • state[0-3]: 四个计算寄存器(A/B/C/D)
  • buffer[64]: 未处理数据的暂存区

三、完整算法实现解析

3.1 初始状态设置


void md5_starts(md5_context* ctx) {
    ctx->total[0] = 0;
    ctx->total[1] = 0;
    // 初始化寄存器(小端序存储)
    ctx->state[0] = 0x67452301; // A
    ctx->state[1] = 0xEFCDAB89; // B
    ctx->state[2] = 0x98BADCFE; // C
    ctx->state[3] = 0x10325476; // D
}

初始值采用正弦函数绝对值的小数部分前32位,十六进制表示为:

  • A: sin(1) = 0x67452301
  • B: sin(2) = 0xEFCDAB89
  • C: sin(3) = 0x98BADCFE
  • D: sin(4) = 0x10325476

3.2 字节序处理宏


#define GET_ULONG_LE(n,b,i) {                 \
    (n) = ( (unsigned long) (b)[(i)    ] )    \
        | ( (unsigned long) (b)[(i)+1] << 8 ) \
        | ( (unsigned long) (b)[(i)+2] << 16 )\
        | ( (unsigned long) (b)[(i)+3] << 24 ); }

#define PUT_ULONG_LE(n,b,i) {                 \
    (b)[(i)  ] = (unsigned char) ( (n)       ); \
    (b)[(i)+1] = (unsigned char) ( (n) >> 8  ); \
    (b)[(i)+2] = (unsigned char) ( (n) >> 16 ); \
    (b)[(i)+3] = (unsigned char) ( (n) >> 24 ); }

实现小端序与主机字节序的转换,保证在不同架构下计算结果的一致性。

3.3 核心变换函数(完整64步实现)


static void md5_process(md5_context* ctx, const unsigned char data[64]) {
    unsigned long X[16], A, B, C, D;

    // 将输入数据分装为16个32位字
    GET_ULONG_LE(X[0],  data,  0);
    GET_ULONG_LE(X[1],  data,  4);
    // ...(完整展开16个X的赋值)
    GET_ULONG_LE(X[15], data, 60);

    A = ctx->state[0];
    B = ctx->state[1];
    C = ctx->state[2];
    D = ctx->state[3];

    // 第一轮运算(F函数)
    #define F(x,y,z) ((z) ^ ((x) & ((y)^(z))))
    P(A, B, C, D,  0,  7, 0xD76AA478);
    P(D, A, B, C,  1, 12, 0xE8C7B756);
    // ...完整16个P操作(共64步)

    // 第二轮运算(G函数)
    #define G(x,y,z) ((y) ^ ((z) & ((x)^(y))))
    P(A, B, C, D,  1,  5, 0xF61E2562);
    // ...完整16个P操作

    // 第三轮运算(H函数)
    #define H(x,y,z) ((x) ^ (y) ^ (z))
    P(A, B, C, D,  5,  4, 0xFFFA3942);
    // ...完整16个P操作

    // 第四轮运算(I函数)
    #define I(x,y,z) ((y) ^ ((x) | ~(z)))
    P(A, B, C, D,  0,  6, 0xF4292244);
    // ...完整16个P操作

    // 更新状态寄存器
    ctx->state[0] += A;
    ctx->state[1] += B;
    ctx->state[2] += C;
    ctx->state[3] += D;
}

四轮运算技术细节:

轮次函数步数位移数序列常数生成方式
1F16[7,12,17,22]循环abs(sin(i+1))×2³²
2G16[5,9,14,20]循环同上
3H16[4,11,16,23]循环同上
4I16[6,10,15,21]循环同上

3.4 消息填充规则


void md5_finish(md5_context* ctx, unsigned char output[16]) {
    unsigned char msglen[8];
    // 计算原始位长度(小端序)
    unsigned long high = (ctx->total[0] >> 29) | (ctx->total[1] << 3);
    unsigned long low = ctx->total[0] << 3;
    PUT_ULONG_LE(low,  msglen, 0);
    PUT_ULONG_LE(high, msglen, 4);

    // 填充步骤
    unsigned long last = ctx->total[0] & 0x3F;
    unsigned long padn = (last < 56) ? 56 - last : 120 - last;
    
    md5_update(ctx, md5_padding, padn); // 填充0x80和0x00
    md5_update(ctx, msglen, 8);         // 附加长度

    // 输出结果
    PUT_ULONG_LE(ctx->state[0], output, 0);
    PUT_ULONG_LE(ctx->state[1], output, 4);
    PUT_ULONG_LE(ctx->state[2], output, 8);
    PUT_ULONG_LE(ctx->state[3], output, 12);
}

填充规范符合RFC1321标准:

  1. 添加一个1位(0x80)
  2. 填充k个0位,使总长度 ≡ 448 mod 512
  3. 附加64位原始消息长度(位长度,小端序)

四、两种典型使用方式

方式1:单次计算(适合完整内存数据)


void md5(unsigned char* input, int ilen, unsigned char output[16]) {
    md5_context ctx;
    md5_starts(&ctx);
    md5_update(&ctx, input, ilen);
    md5_finish(&ctx, output);
}

// 使用示例
unsigned char hash[16];
char msg[] = "Hello MD5";
md5((unsigned char*)msg, strlen(msg), hash);

方式2:流式处理(适合大文件/分块数据)


// 分块处理示例
md5_context ctx;
unsigned char hash[16];
FILE* file = fopen("largefile.bin", "rb");

md5_starts(&ctx);

// 以64KB为块读取处理
unsigned char buffer[65536];
size_t bytes_read;
while((bytes_read = fread(buffer, 1, 65536, file)) > 0) {
    md5_update(&ctx, buffer, bytes_read);
}

md5_finish(&ctx, hash);
fclose(file);
对比项单次计算流式处理
内存占用需要完整数据支持分块处理
适用场景小文件/字符串大文件/网络流
API调用单次调用start-update-finish三部曲

五、安全性增强建议

尽管MD5仍可用于非安全场景,但建议采取以下加固措施:

  1. 加盐处理:对密码类数据添加随机salt
    md5(salt + password)
  2. 多重哈希:组合其他算法
    sha256(md5(data))
  3. 迭代哈希:增加计算成本
    for(1000次) data = md5(data)

六、算法复杂度分析

MD5的时间复杂度为O(n),空间复杂度O(1):

  • 每个512位分组的计算时间恒定
  • 内存占用固定(上下文结构体大小恒定)
  • 预处理阶段需要 (n+72)/64 次分组处理

七、完整代码

md5.h文件

#ifndef __MD5_H__
#define __MD5_H__

 /**
  * \brief          MD5 context structure
  */
typedef struct
{
    unsigned long total[2];     /*!< number of bytes processed  */
    unsigned long state[4];     /*!< intermediate digest state  */
    unsigned char buffer[64];   /*!< data block being processed */
}
md5_context;

    /**
     * \brief          MD5 context setup
     *
     * \param ctx      context to be initialized
     */
    void md5_starts(md5_context* ctx);

    /**
     * \brief          MD5 process buffer
     *
     * \param ctx      MD5 context
     * \param input    buffer holding the  data
     * \param ilen     length of the input data
     */
    void md5_update(md5_context* ctx, const unsigned char* input, int ilen);

    /**
     * \brief          MD5 final digest
     *
     * \param ctx      MD5 context
     * \param output   MD5 checksum result
     */
    void md5_finish(md5_context* ctx, unsigned char output[16]);

    /**
     * \brief          Output = MD5( input buffer )
     *
     * \param input    buffer holding the  data
     * \param ilen     length of the input data
     * \param output   MD5 checksum result
     */
    void md5(unsigned char* input, int ilen, unsigned char output[16]);
#endif

md5.c文件

#include "md5.h"
#include <string.h>
#include "stdio.h"
  /*
   * 32-bit integer manipulation macros (little endian)
   */
#ifndef GET_ULONG_LE
#define GET_ULONG_LE(n,b,i)                             \
{                                                       \
    (n) = ( (unsigned long) (b)[(i)    ]       )        \
        | ( (unsigned long) (b)[(i) + 1] <<  8 )        \
        | ( (unsigned long) (b)[(i) + 2] << 16 )        \
        | ( (unsigned long) (b)[(i) + 3] << 24 );       \
}
#endif

#ifndef PUT_ULONG_LE
#define PUT_ULONG_LE(n,b,i)                             \
{                                                       \
    (b)[(i)    ] = (unsigned char) ( (n)       );       \
    (b)[(i) + 1] = (unsigned char) ( (n) >>  8 );       \
    (b)[(i) + 2] = (unsigned char) ( (n) >> 16 );       \
    (b)[(i) + 3] = (unsigned char) ( (n) >> 24 );       \
}
#endif

   /*
    * MD5 context setup
    */
void md5_starts(md5_context* ctx)
{
    ctx->total[0] = 0;
    ctx->total[1] = 0;

    ctx->state[0] = 0x67452301;
    ctx->state[1] = 0xEFCDAB89;
    ctx->state[2] = 0x98BADCFE;
    ctx->state[3] = 0x10325476;
}

static void md5_process(md5_context* ctx, const unsigned char data[64])
{
    unsigned long X[16], A, B, C, D;

    GET_ULONG_LE(X[0], data, 0);
    GET_ULONG_LE(X[1], data, 4);
    GET_ULONG_LE(X[2], data, 8);
    GET_ULONG_LE(X[3], data, 12);
    GET_ULONG_LE(X[4], data, 16);
    GET_ULONG_LE(X[5], data, 20);
    GET_ULONG_LE(X[6], data, 24);
    GET_ULONG_LE(X[7], data, 28);
    GET_ULONG_LE(X[8], data, 32);
    GET_ULONG_LE(X[9], data, 36);
    GET_ULONG_LE(X[10], data, 40);
    GET_ULONG_LE(X[11], data, 44);
    GET_ULONG_LE(X[12], data, 48);
    GET_ULONG_LE(X[13], data, 52);
    GET_ULONG_LE(X[14], data, 56);
    GET_ULONG_LE(X[15], data, 60);

#define S(x,n) ((x << n) | ((x & 0xFFFFFFFF) >> (32 - n)))

#define P(a,b,c,d,k,s,t)                                \
{                                                       \
    a += F(b,c,d) + X[k] + t; a = S(a,s) + b;           \
}

    A = ctx->state[0];
    B = ctx->state[1];
    C = ctx->state[2];
    D = ctx->state[3];

#define F(x,y,z) (z ^ (x & (y ^ z)))

    P(A, B, C, D, 0, 7, 0xD76AA478);
    P(D, A, B, C, 1, 12, 0xE8C7B756);
    P(C, D, A, B, 2, 17, 0x242070DB);
    P(B, C, D, A, 3, 22, 0xC1BDCEEE);
    P(A, B, C, D, 4, 7, 0xF57C0FAF);
    P(D, A, B, C, 5, 12, 0x4787C62A);
    P(C, D, A, B, 6, 17, 0xA8304613);
    P(B, C, D, A, 7, 22, 0xFD469501);
    P(A, B, C, D, 8, 7, 0x698098D8);
    P(D, A, B, C, 9, 12, 0x8B44F7AF);
    P(C, D, A, B, 10, 17, 0xFFFF5BB1);
    P(B, C, D, A, 11, 22, 0x895CD7BE);
    P(A, B, C, D, 12, 7, 0x6B901122);
    P(D, A, B, C, 13, 12, 0xFD987193);
    P(C, D, A, B, 14, 17, 0xA679438E);
    P(B, C, D, A, 15, 22, 0x49B40821);

#undef F

#define F(x,y,z) (y ^ (z & (x ^ y)))

    P(A, B, C, D, 1, 5, 0xF61E2562);
    P(D, A, B, C, 6, 9, 0xC040B340);
    P(C, D, A, B, 11, 14, 0x265E5A51);
    P(B, C, D, A, 0, 20, 0xE9B6C7AA);
    P(A, B, C, D, 5, 5, 0xD62F105D);
    P(D, A, B, C, 10, 9, 0x02441453);
    P(C, D, A, B, 15, 14, 0xD8A1E681);
    P(B, C, D, A, 4, 20, 0xE7D3FBC8);
    P(A, B, C, D, 9, 5, 0x21E1CDE6);
    P(D, A, B, C, 14, 9, 0xC33707D6);
    P(C, D, A, B, 3, 14, 0xF4D50D87);
    P(B, C, D, A, 8, 20, 0x455A14ED);
    P(A, B, C, D, 13, 5, 0xA9E3E905);
    P(D, A, B, C, 2, 9, 0xFCEFA3F8);
    P(C, D, A, B, 7, 14, 0x676F02D9);
    P(B, C, D, A, 12, 20, 0x8D2A4C8A);

#undef F

#define F(x,y,z) (x ^ y ^ z)

    P(A, B, C, D, 5, 4, 0xFFFA3942);
    P(D, A, B, C, 8, 11, 0x8771F681);
    P(C, D, A, B, 11, 16, 0x6D9D6122);
    P(B, C, D, A, 14, 23, 0xFDE5380C);
    P(A, B, C, D, 1, 4, 0xA4BEEA44);
    P(D, A, B, C, 4, 11, 0x4BDECFA9);
    P(C, D, A, B, 7, 16, 0xF6BB4B60);
    P(B, C, D, A, 10, 23, 0xBEBFBC70);
    P(A, B, C, D, 13, 4, 0x289B7EC6);
    P(D, A, B, C, 0, 11, 0xEAA127FA);
    P(C, D, A, B, 3, 16, 0xD4EF3085);
    P(B, C, D, A, 6, 23, 0x04881D05);
    P(A, B, C, D, 9, 4, 0xD9D4D039);
    P(D, A, B, C, 12, 11, 0xE6DB99E5);
    P(C, D, A, B, 15, 16, 0x1FA27CF8);
    P(B, C, D, A, 2, 23, 0xC4AC5665);

#undef F

#define F(x,y,z) (y ^ (x | ~z))

    P(A, B, C, D, 0, 6, 0xF4292244);
    P(D, A, B, C, 7, 10, 0x432AFF97);
    P(C, D, A, B, 14, 15, 0xAB9423A7);
    P(B, C, D, A, 5, 21, 0xFC93A039);
    P(A, B, C, D, 12, 6, 0x655B59C3);
    P(D, A, B, C, 3, 10, 0x8F0CCC92);
    P(C, D, A, B, 10, 15, 0xFFEFF47D);
    P(B, C, D, A, 1, 21, 0x85845DD1);
    P(A, B, C, D, 8, 6, 0x6FA87E4F);
    P(D, A, B, C, 15, 10, 0xFE2CE6E0);
    P(C, D, A, B, 6, 15, 0xA3014314);
    P(B, C, D, A, 13, 21, 0x4E0811A1);
    P(A, B, C, D, 4, 6, 0xF7537E82);
    P(D, A, B, C, 11, 10, 0xBD3AF235);
    P(C, D, A, B, 2, 15, 0x2AD7D2BB);
    P(B, C, D, A, 9, 21, 0xEB86D391);

#undef F

    ctx->state[0] += A;
    ctx->state[1] += B;
    ctx->state[2] += C;
    ctx->state[3] += D;
}

/*
 * MD5 process buffer
 */
void md5_update(md5_context* ctx, const unsigned char* input, int ilen)
{
    int fill;
    unsigned long left;

    if (ilen <= 0)
        return;

    left = ctx->total[0] & 0x3F;
    fill = 64 - left;

    ctx->total[0] += ilen;
    ctx->total[0] &= 0xFFFFFFFF;

    if (ctx->total[0] < (unsigned long)ilen)
        ctx->total[1]++;

    if (left && ilen >= fill)
    {
        memcpy((void*)(ctx->buffer + left),
            input, fill);
        md5_process(ctx, ctx->buffer);
        input += fill;
        ilen -= fill;
        left = 0;
    }

    while (ilen >= 64)
    {
        md5_process(ctx, input);
        input += 64;
        ilen -= 64;
    }

    if (ilen > 0)
    {
        memcpy((void*)(ctx->buffer + left),
            input, ilen);
    }
}

static const unsigned char md5_padding[64] =
{
 0x80, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
    0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
    0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
    0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
};

/*
 * MD5 final digest
 */
void md5_finish(md5_context* ctx, unsigned char output[16])
{
    unsigned long last, padn;
    unsigned long high, low;
    unsigned char msglen[8];

    high = (ctx->total[0] >> 29)
        | (ctx->total[1] << 3);
    low = (ctx->total[0] << 3);

    PUT_ULONG_LE(low, msglen, 0);
    PUT_ULONG_LE(high, msglen, 4);

    last = ctx->total[0] & 0x3F;
    padn = (last < 56) ? (56 - last) : (120 - last);

    md5_update(ctx, md5_padding, padn);
    md5_update(ctx, msglen, 8);

    PUT_ULONG_LE(ctx->state[0], output, 0);
    PUT_ULONG_LE(ctx->state[1], output, 4);
    PUT_ULONG_LE(ctx->state[2], output, 8);
    PUT_ULONG_LE(ctx->state[3], output, 12);
}

/*
 * output = MD5( input buffer )
 */
void md5(unsigned char* input, int ilen, unsigned char output[16])
{
    md5_context ctx;
    memset(&ctx, 0, sizeof(md5_context));
    md5_starts(&ctx);
    md5_update(&ctx, input, ilen);
    md5_finish(&ctx, output);
}




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值