数据安全之散列函数（三）- MD4 算法原理详解

猩Talk

已于 2024-01-21 15:02:53 修改

阅读量1.6k

点赞数 31

文章标签：算法安全哈希

于 2024-01-19 14:45:01 首次发布

本文链接：https://blog.csdn.net/madfrogxin/article/details/135697138

版权

本文深入解析MD4算法，尽管已不再安全，但作为许多哈希算法的基础，理解其原理至关重要。MD4对任意长度数据生成128bit哈希值，通过初始向量、数据分块、常量定义和循环计算四个步骤进行处理。下篇将探讨MD5算法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

MD5 是 Message-Digest Algorithm 信息摘要算法的简写，是一种无密钥的迭代 hash 算法。OpenJDK 中 MD5 的实现类 org.bouncycastle.crypto.digests.MD5Digest，《Handbook of Applied Cryptography》这本书的第 346 - 347 对 MD5 算法进行了详细的描述。

Chapter 9 - Hash Functions and Data Integrity

MD4 算法详解

在介绍 MD5 之前我们首先来介绍下 MD4算法，虽然 MD4 算法已经不再安全，但是 MD4 算法是大部分 hash 算法的基础，MD5 也是在 MD4 算法的基础上做了一些优化而来的。
MD4 算法输入是任意长度的数据，得到的结果是 128bit 的哈希值。算法处理流程如下：

“2.预处理”部分我们在上一篇文章中已经讲了。数据安全之散列函数（二）- 数据分组与数据填充。
MD4 每个分块分块大小为 512bit ，经过预处理后，会得到一组 512bit 长度的数据块 $x_1,x_2...x_n$ 。
“3.迭代处理”部分的，就是循环将 $x_n$ 和上一轮的结果进行计算得到新的结果。

初始向量（IV）

我们在第一轮计算的时候还没有上一轮的数据怎么办？这时候就要定义一组初始的数据，用于第一轮计算。这组数据就叫做初始向量（IV）。MD4 中定义如下，每个数据 32bit 总共 128bit：
$h_1 = 0x67452301$ ,
$h_2 = 0xefcdab89$ ,
$h_3 = 0x98badcfe$ ,
$h_4 = 0x10325476$

数据分块

首先我们来看第一块 512bit 数据的操作。每一块数据被切分成 16 个 32bit 的小块。这 16 个 32bit 的数据我们定义为 $X$ , 如 $X [0]$ 就代表下面第 0 块的数据。

定义常量

再来定义 3 组常量，后面计算中会用到：

定义 32-bit 附加值常量 $y$ ：

$y [j] = 0, 0 \leq j \leq 15$ ;
$y [j] = 0 x 5 a 827999, 16 \leq j \leq 31; (2 的平方根前 32 - bi t)$ ;
$y [j] = 0 x 6 e d 9 e ba 1, 32 \leq j \leq 47; (3 的平方根前 32 - bi t)$ ;

定义原始输入值访问顺序常量 $z$ :

$z [0..15] = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]$ ;
$z [16..31] = [0, 4, 8, 12, 1, 5, 9, 13, 2, 6, 10, 14, 3, 7, 11, 15]$ ;
$z [32..47] = [0, 8, 4, 12, 2, 10, 6, 14, 1, 9, 5, 13, 3, 11, 7, 15]$ .

最后定义每一个位置循环左移的位数常量 $s$ :

$s [0..15] = [3, 7, 11, 19, 3, 7, 11, 19, 3, 7, 11, 19, 3, 7, 11, 19],$
$s [16..31] = [3, 5, 9, 13, 3, 5, 9, 13, 3, 5, 9, 13, 3, 5, 9, 13],$
$s [32..47] = [3, 9, 11, 15, 3, 9, 11, 15, 3, 9, 11, 15, 3, 9, 11, 15] .$

循环计算

循环变量为 $j$ 取值范围为 $\le j \le 47$ 。
$j$ 取值在 $\le j \le 15$ ， $\le j \le 31$ , $\le j \le 47$ 三个区间分别代表三个不同的轮次。

第一轮 $\le j \le 15$ ，上图所示。
当 $j = 0$ 时，还没有上一轮的数据，所以 $A, B, C, D$ 使用初始化向量（IV） $h_0,h_1,h_2,h_3$ 进行赋值。