MD5算法的实现以及相关应用（web信息检索实验）

最新推荐文章于 2024-06-15 15:23:37 发布

Mr.羊

最新推荐文章于 2024-06-15 15:23:37 发布

阅读量173

点赞数 1

分类专栏： web工程文章标签：开发语言

本文链接：https://blog.csdn.net/weixin_52552833/article/details/132250959

版权

web工程专栏收录该内容

4 篇文章 0 订阅

订阅专栏

MD5算法的实现以及相关应用

1.基本介绍：

在Web信息的检索过程中，对文本的保存和建立文本索引是文本检索的关键步骤。而保存文本，并对这些文本建立索引，就需要对已有的网页进行预处理。而MD5算法就是预处理两个过程中的其中一个——网页去重的常用算法。MD5(Message Digest5)算法，顾名思义，这个算法的基本思想是通过信息摘要的方式，将消息的特征进行提取，网页去重则就是基于提取的这些特征来判重，完成网页去重的目的。

2.算法描述

消息长度任意，但准备时需将其分成若干个512bit的组，每一分组又被划分为16个32bit的子分组，经过处理后，输出四个32bit的分组，级联后生成128bit的消息摘要。

具体步骤如下：

①填充：对消息进行填充，使其字节长度对512取余的结果为448，即信息的长度为N*512+448 bit => N*64+56 Byte（N为正整数）。而填充的方法是将信息后填充一个1和若干0，直到满足信息长度的条件。最后，再附加一个一64位的二进制数来表示填充前的长度。填充后的信息长度为512bit的整数倍。

②初始化MD缓冲器：用4个32bit的寄存器，每轮输出128bit。。用A，B，C，D四个32bit字，将初始存数以十六进制表示：

A = 0x01234567；B = 0x89ABCDEF；C = 0xFEDCBA98；D = 0x76543210

③处理分组：通过4轮循环的函数处理各个分组，循环次数是512bit分组数。4轮循环的每一轮是相似的，每次操作对A,B,C,D中的三个做一次非线性函数运算，再将结果加上第四个变量，再将所得结果向右环移一个不定的数，并加上A,B,C,D中之一。最后，用该结果取代 A,B,C,D中之一。

四次非线性函数如下：

f(x,y,z) =(x&y)|((~x)&z)

g(x,y,z) =(x&z)|(y&(~z))

h(x,y,z) =x^y^z

i(x,y,z)=y^(x|(~z))

其中&是与，|是或，~是非，^是异或

通过这四个函数，说明了如果x、y、z的对应位是独立和均匀的，那么结果的每一位也是独立和均匀的。

④输出消息摘要：将L个分组处理完后，其输出便是所需的128bit的消息摘要。