概述
- 如果一个哈希函数是单向的而且是抗碰撞的,那么这个哈希函数就是安全的。其中一个属性确保给一个散列值h,我们在计算上无法找到一个输入m使得hash(m)=h.抗碰撞属性确保,在计算机上是不可行找到一个输入m和一个输入n,使得hash(m)=hash(n).这个实验将发动MD5的碰撞攻击,使用了Fast MD5 Collision Generator工具。
生成两个不同的文件但是文件具有相同的散列值
- 我们可以创建两个具有相同开始部分或者前缀的文件,我们通过使用上述的工具,允许我们创建任意文件,文件的内容使用前缀来生成两个文件out1.bin和out2.bin,而且文件我们具有相同的散列值,命令是:
md5collgen -p prefix.txt -o out1.bin out2.bin
- 这个工具生成P部分和Q部分对于给定的前缀文件,以至于hash(prefix+P) = hash(prefix + Q),检查输出文件是否不同和哈希和是否相同,我们可以使用如下命令:
diff out1.bin out2.bin
md5sum out1.bin
md5sum out2.bin
- 我们可以使用十六进制工具例如(GHex)来阅读和修改二进制文件,我也能使用python传递值到前缀文件里:
echo $(python -c 'print("\x41"*55)') > prefix.txt
- 如果前缀文件的长度不是64字节的倍数,我们使用这个工具产生的两个输出文件,这两个文件使用diff命令来验证是不同的,我们使用二进制查看器查看文件,发现前缀不是64字节的倍数会被规则的表达式(0A 00*)填充到64字节的倍数:
[07/21/20]seed@VM:~/.../md5$ bless out1.bin
5. 如果前缀文件的长度正好是64字节,这个工具依旧会填充接下来的64字节,如果前缀文件的长度正好是64字节的倍数,这个工具依旧会在填充末尾填充64字节。
[07/21/20]seed@VM:~/.../md5$ echo $(python -c 'print("\x41"*128)') > prefix.txt
[07/21/20]seed@VM:~/.../md5$ md5collgen -p prefix.txt -o out1.bin out2.bin
MD5 collision generator v1.5
by Marc Stevens (http://www.win.tue.nl/hashclash/)
Using output filenames: 'out1.bin' and 'out2.bin'
Using prefixfile: 'prefix.txt'
Using initial value: ad6f4e4a41d6537e542cc98a3d226a0b
Generating first block: ....
Generating second block: W....................
Running time: 2.99625 s
[07/21/20]seed@VM:~/.../md5$ bless out1.bin
- 下面这个例子中,两个文件可能有轻微的不同,因为前缀文件已经有60字节,还需要填充4个字节,因此两个文件的数据可能会不同,对于下面这种情况,在93和BB便宜处实际上的值是不同的。
[07/21/20]seed@VM:~/.../md5$ echo $(python -c 'print("\x41"*60)') > prefix.txt
[07/21/20]seed@VM:~/.../md5$ md5collgen -p prefix.txt -o out1.bin out2.bin
明白MD5的属性
- 我们能得到一个性质,给两个输入M和N,如果MD5(M)=MD5(N),任意输入T,一定会有MD5(M||T)=MD5(N||T),因此,添加一个后缀给任意两个具有相同散列值的消息,生成两个更长的消息,这两个更长的消息仍然具有相同的散列值。
- 通过以下实验论述
[07/21/20]seed@VM:~/.../md5$ cat > prefix
asdfghjkl
[07/21/20]seed@VM:~/.../md5$ md5collgen -p prefix -o file1 file2
MD5 collision generator v1.5
by Marc Stevens (http://www.win.tue.nl/hashclash/)
Using output filenames: 'file1' and 'file2'
Using prefixfile: 'prefix'
Using initial value: 3c314196e1dd87fadfe827be4e35094c
Generating first block: ....
Generating second block: S10...
Running time: 4.56892 s
[07/21/20]seed@VM:~/.../md5$ diff file1 file2
Binary files file1 and file2 differ
[07/21/20]seed@VM:~/.../md5$ cat > suffix
qwerty
[07/21/20]seed@VM:~/.../md5$ md5sum file1
e658cab2ca4f5630922e425dadb5144f file1
[07/21/20]seed@VM:~/.../md5$ md5sum file2
e658cab2ca4f5630922e425dadb5144f file2
[07/21/20]seed@VM:~/.../md5$ cat file1 suffix > modfile1
[07/21/20]seed@VM:~/.../md5$ cat file2 suffix > modfile2
[07/21/20]seed@VM:~/.../md5$ md5sum modfile1
ebc8935dd27a94fea75b0dd1f77f2085 modfile1
[07/21/20]seed@VM:~/.../md5$ md5sum modfile2
ebc8935dd27a94fea75b0dd1f77f2085 modfile2
- file1与file2具有相同的MD5值,我们将相同的后缀分别添加到file1与file2文件的末尾,结果添加之后新文件modfile1与modfile2仍然具有相同的散列值。
产生两个可执行文件有相同的MD5散列值
- 使用下面代码,创造两个不同版本的程序,使数组的内容不同,但是它们的可执行文件的哈希值是相同的:
#include <stdio.h>
unsigned char xyz[200] = {
}; // populated with self values.
int main()
{
int i;
for (i=0; i<200; i++)
{
printf("%x", xyz[i]);
}
printf("\n");
return 0;
}
- 我们填充用字符’A’填充数组的内容,因为这有利于我们在程序编译成可执行文件后定位数组的位置:
#include <stdio.h>
unsigned char xyz[200]={
'A','A','A','A','A','A','A','A','A','A','A','A','A','A','A','A','A','A','A','A','A','A','A','A'