Java 加解密技术之 MD5

上一篇文章中,介绍了最基础的编码方式 — — BASE64,也简单的提了一下编码的原理。这篇文章继续加解密的系列,当然也是介绍比较基础的加密方式 — — MD5,MD5 属于单向加密算法,是不可逆的加密方式,也就是说,采用了 MD5 加密方式加密之后,就不能对加密的结果进行解密,得到原有的字符串,这是不可以的。

背景

相信在我们的生活中,MD5 用到的还是很广泛的。在说 MD5 之前,首先来了解一下单向加密算法都有哪些。当然,MD5 是其中之一,除此之外还有,SHA,HMAC 等这几种算法。不过,今天这篇文章,我们只介绍 MD5,至于 SHA 和 HMAC 在后续的文章中会陆续的介绍。

正文

MD5,全称为“Message Digest Algorithm 5”,中文名“消息摘要算法第五版”,它是计算机安全领域广泛使用的一种散列函数,用以提供消息的完整性保护。严格来说,它是一种摘要算法,是确保信息完整性的。不过,在某种意义上来说,也可以算作一种加密算法。

MD5 算法具有很多特点:
压缩性:任意长度的数据,算出的MD5值长度都是固定的。
容易计算:从原数据计算出MD5值很容易。
抗修改性:对原数据进行任何改动,哪怕只修改1个字节,所得到的MD5值都有很大区别。
弱抗碰撞:已知原数据和其MD5值,想找到一个具有相同MD5值的数据(即伪造数据)是非常困难的。
强抗碰撞:想找到两个不同的数据,使它们具有相同的MD5值,是非常困难的。

MD5 的作用是让大容量信息在用数字签名软件签署私人密钥前被"压缩"成一种保密的格式(就是把一个任意长度的字节串变换成一定长的十六进制数字串)。

MD5 其实在我们生活中是很常用的,似乎你并没有注意到,当你下载了一个镜像之后,你会发现下载页面还提供了一组 MD5 值,那么这组 MD5 值是用来做什么的呢?了解了 MD5 的作用之后,你就不难想到,MD5 是用来验证文件的一致性的,当你下载好镜像之后,你需要对该镜像做一次 MD5 的校验,得到的 MD5 值与下载页面提供的 MD5 值进行对比,以此来验证该镜像是否被篡改。

为什么 MD5 就可以进行一致性校验呢?

其实,MD5 就和人的指纹一样,每个人的指纹都是唯一的,而文件的 MD5 值也是唯一的。至于为什么会这样呢?下面我们看一下 MD5 的工作原理。

对 MD5 算法简要的叙述可以为:MD5 以 512 位分组来处理输入的信息,且每一分组又被划分为 16 个 32 位子分组,经过了一系列的处理后,算法的输出由四个 32 位分组组成,将这四个 32 位分组级联后将生成一个 128 位散列值。

总体流程如下图所示, 表示第 i 个分组,每次的运算都由前一轮的 128 位结果值和第 i 块 512 bit 值进行运算。




填充

在 MD5 算法中,首先需要对信息进行填充,使其位长对 512 求余的结果等于 448,并且填充必须进行,即使其位长对 512 求余的结果等于 448。因此,信息的位长(Bits Length)将被扩展至 N * 512 + 448,N 为一个非负整数,N 可以是零。
填充的方法如下:
1) 在信息的后面填充一个 1 和无数个 0,直到满足上面的条件时才停止用 0 对信息的填充。
2) 在这个结果后面附加一个以 64 位二进制表示的填充前信息长度(单位为Bit),如果二 进制表示的填充前信息长度超过 64 位,则取低 64 位。
经过这两步的处理,信息的位长 = N * 512 + 448 + 64 = (N + 1)* 512,即长度恰好是 512 的整数倍。这样做的原因是为满足后面处理中对信息长度的要求。

初始化变量

初始的 128 位值为初试链接变量,这些参数用于第一轮的运算,以大端字节序来表示,他们分别为: A = 0x01234567,B = 0x89ABCDEF,C = 0xFEDCBA98,D = 0x76543210。
(每一个变量给出的数值是高字节存于内存低地址,低字节存于内存高地址,即大端字节序。在程序中变量 A、B、C、D 的值分别为0x67452301,0xEFCDAB89,0x98BADCFE,0x10325476)

处理分组数据

每一分组的算法流程如下:
第一分组需要将上面四个链接变量复制到另外四个变量中:A 到 a,B 到 b,C 到 c,D 到 d。从第二分组开始的变量为上一分组的运算结果,即 A = a, B = b, C = c, D = d。
主循环有四轮,每轮循环都很相似。第一轮进行 16 次操作。每次操作对 a、b、c 和 d 中的其中三个作一次非线性函数运算,然后将所得结果加上第四个变量,文本的一个子分组和一个常数。再将所得结果向左环移一个不定的数,并加上 a、b、c 或 d 中之一。最后用该结果取代 a、b、c 或 d 中之一。

输出

最后的输出是 a、b、c 和 d 的级联。

代码

这里提供一个 Java 版本的实现,不过需要说明的一点是,这个 Java 实现对于英文的 MD5 是没有问题的,但对于中文会有点问题,因此,推荐只作为学习为目的来参考。如果是项目中的生产需要,请选择 jdk 中自带的 MD5 加密函数。
   
   
  1. <span style="font-family:Arial;font-size:12px;">package com.sica.md5.impl;
  2. /**
  3. * Created by xiang.li on 2015/2/26.
  4. */
  5. public class MD5 {
  6. /**
  7. * 单例
  8. */
  9. private static MD5 instance;
  10. /**
  11. * 四个链接变量
  12. */
  13. private final int A = 0x67452301;
  14. private final int B = 0xefcdab89;
  15. private final int C = 0x98badcfe;
  16. private final int D = 0x10325476;
  17. /**
  18. * ABCD的临时变量
  19. */
  20. private int Atemp;
  21. private int Btemp;
  22. private int Ctemp;
  23. private int Dtemp;
  24. /**
  25. * 常量ti
  26. * 公式:floor(abs(sin(i+1))×(2pow32)
  27. */
  28. private final int[] K = {
  29. 0xd76aa478, 0xe8c7b756, 0x242070db, 0xc1bdceee,
  30. 0xf57c0faf, 0x4787c62a, 0xa8304613, 0xfd469501, 0x698098d8,
  31. 0x8b44f7af, 0xffff5bb1, 0x895cd7be, 0x6b901122, 0xfd987193,
  32. 0xa679438e, 0x49b40821, 0xf61e2562, 0xc040b340, 0x265e5a51,
  33. 0xe9b6c7aa, 0xd62f105d, 0x02441453, 0xd8a1e681, 0xe7d3fbc8,
  34. 0x21e1cde6, 0xc33707d6, 0xf4d50d87, 0x455a14ed, 0xa9e3e905,
  35. 0xfcefa3f8, 0x676f02d9, 0x8d2a4c8a, 0xfffa3942, 0x8771f681,
  36. 0x6d9d6122, 0xfde5380c, 0xa4beea44, 0x4bdecfa9, 0xf6bb4b60,
  37. 0xbebfbc70, 0x289b7ec6, 0xeaa127fa, 0xd4ef3085, 0x04881d05,
  38. 0xd9d4d039, 0xe6db99e5, 0x1fa27cf8, 0xc4ac5665, 0xf4292244,
  39. 0x432aff97, 0xab9423a7, 0xfc93a039, 0x655b59c3, 0x8f0ccc92,
  40. 0xffeff47d, 0x85845dd1, 0x6fa87e4f, 0xfe2ce6e0, 0xa3014314,
  41. 0x4e0811a1, 0xf7537e82, 0xbd3af235, 0x2ad7d2bb, 0xeb86d391
  42. };
  43. /**
  44. * 向左位移数,计算方法未知
  45. */
  46. private final int[] s = {
  47. 7, 12, 17, 22, 7, 12, 17, 22, 7, 12, 17, 22, 7,
  48. 12, 17, 22, 5, 9, 14, 20, 5, 9, 14, 20, 5, 9, 14, 20, 5, 9, 14, 20,
  49. 4, 11, 16, 23, 4, 11, 16, 23, 4, 11, 16, 23, 4, 11, 16, 23, 6, 10,
  50. 15, 21, 6, 10, 15, 21, 6, 10, 15, 21, 6, 10, 15, 21
  51. };
  52. /**
  53. * 私有构造函数
  54. */
  55. private MD5() {
  56. }
  57. /**
  58. * 单例模式
  59. * @return
  60. */
  61. public static MD5 getInstance() {
  62. if (instance == null) {
  63. instance = new MD5();
  64. }
  65. return instance;
  66. }
  67. /**
  68. * 初始化函数
  69. */
  70. private void init() {
  71. Atemp = A;
  72. Btemp = B;
  73. Ctemp = C;
  74. Dtemp = D;
  75. }
  76. /**
  77. * 移动一定位数
  78. * @param a
  79. * @param s
  80. * @return
  81. */
  82. private int shift(int a, int s) {
  83. return (a << s) | (a >>> (32 - s)); // 右移的时候,高位一定要补零,而不是补充符号位
  84. }
  85. /**
  86. * 主循环
  87. * @param M
  88. */
  89. private void mainLoop(int[] M) {
  90. int F;
  91. int g;
  92. int a = Atemp;
  93. int b = Btemp;
  94. int c = Ctemp;
  95. int d = Dtemp;
  96. for (int i = 0; i < 64; i++) {
  97. if (i < 16) {
  98. F = (b & c) | ((~b) & d);
  99. g = i;
  100. }else if (i < 32) {
  101. F = (d & b) | ((~d) & c);
  102. g = (5 * i + 1) % 16;
  103. }else if (i < 48) {
  104. F = b ^ c ^ d;
  105. g = (3 * i + 5) % 16;
  106. } else {
  107. F = c ^ (b | (~d));
  108. g = (7 * i) % 16;
  109. }
  110. int tmp = d;
  111. d = c;
  112. c = b;
  113. b = b + shift(a + F + K[i] + M[g], s[i]);
  114. a = tmp;
  115. }
  116. Atemp += a;
  117. Btemp += b;
  118. Ctemp += c;
  119. Dtemp += d;
  120. }
  121. /**
  122. * 填充函数
  123. * 处理后应满足bits≡448(mod512),字节就是bytes≡56(mode64)
  124. * 填充方式为先加一个0,其它位补零
  125. * 最后加上64位的原来长度
  126. * @param str
  127. * @return
  128. */
  129. private int[] add(String str) {
  130. int num = ((str.length() + 8) / 64) + 1; // 以512位,64个字节为一组
  131. int[] strByte = new int[num * 16]; // 64/4=16,所以有16个整数
  132. for (int i = 0; i < num * 16; i++) {
  133. // 全部初始化为0
  134. strByte[i] = 0;
  135. }
  136. int j;
  137. for (j = 0; j < str.length(); j++) {
  138. strByte[j >> 2] |= str.charAt(j) << ((j % 4) * 8); // 一个整数存储四个字节,小端序
  139. }
  140. strByte[j >> 2] |= 0x80 << ((j % 4) * 8); // 尾部添加1
  141. // 添加原长度,长度指位的长度,所以要乘8,然后是小端序,所以放在倒数第二个,这里长度只用了32位
  142. strByte[num * 16 - 2] = str.length() * 8;
  143. return strByte;
  144. }
  145. /**
  146. * 调用函数
  147. * @param source 原始字符串
  148. * @return
  149. */
  150. public String getMD5(String source) {
  151. // 初始化
  152. init();
  153. int[] strByte = add(source);
  154. for (int i = 0; i < strByte.length / 16; i += 16) {
  155. int[] num = new int[16];
  156. for (int j = 0; j < 16; j++) {
  157. num[j] = strByte[i * 16 + j];
  158. }
  159. mainLoop(num);
  160. }
  161. return changeHex(Atemp) + changeHex(Btemp) + changeHex(Ctemp) + changeHex(Dtemp);
  162. }
  163. /**
  164. * 整数变成16进制字符串
  165. * @param a 整数
  166. * @return
  167. */
  168. private String changeHex(int a) {
  169. String str="";
  170. String tmp = "";
  171. for(int i=0;i<4;i++) {
  172. tmp = Integer.toHexString(((a >> i * 8) % (1 << 8)) & 0xff);
  173. if (tmp.length() < 2) {
  174. tmp = "0" + tmp;
  175. }
  176. str += tmp;
  177. }
  178. return str;
  179. }
  180. /**
  181. * 测试方法
  182. * @param args
  183. */
  184. public static void main(String[] args) {
  185. String str = MD5.getInstance().getMD5("");
  186. String str1 = MD5.getInstance().getMD5("123");
  187. System.out.println(str);
  188. System.out.println("d41d8cd98f00b204e9800998ecf8427e");
  189. System.out.println(str1);
  190. System.out.println("202cb962ac59075b964b07152d234b70");
  191. }
  192. }</span><span style="font-family:微软雅黑;font-size: 14px;">
  193. </span>

结束语

或许你经常见到 MD5,但你从来没有注意过,到底什么才是 MD5。也或许你知道什么是 MD5,但或许你并不了解 MD5 是作何用的。那么,从今天起,从你读完这篇博客起,我相信,以后再见到 MD5 的时候,你肯定会对它印象深刻,再下载文件的时候,也会对它进行 MD5 的一致性校验。那么,我就可以说,我的这篇文章还是起到了一丁点的作用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值