MD5 (Message Digest Algorithm 5 信息—摘要算法5 ) 的一些体会
一、若我们定义一个函数 ,原型为:
String MD5 ( Information info)
其中Information 表示任意长度的信息,注意是任意长度的。
实现这个函数的最终要求:
1、对于不同的输入信息,产生的返回值 结果不同 且必须唯一
2. 改算法不可逆转,也就是就算拥有 返回结果和算法细节,也不可能推导出输入的初始信息。
下面是MD5算法对一些特定值产生的返回值:
md5 ("") = d41d8cd98f00b204e9800998ecf8427e
md5 ("a") = 0cc175b9c0f1b6a831c399e269772661
md5 ("abc") = 900150983cd24fb0d6963f7d28e17f72
md5 ("message digest") = f96b697d7cb7938d525a2f31aaf161d0
md5 ("abcdefghijklmnopqrstuvwxyz") = c3fcd3d76192e4007dfb496cca67e13b
md5("abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz0123456789")
=d174ab98d277d9f5a5611c2c9f419d9f md5("12345678901234567890123456789012345678901234567890123456789012345678901234567890") = 57edf4a22be3c955ac49da2e2107b67a
对于第二个要求,就是说,给你 一个 32位的字符串d41d8cd98f00b204e9800998ecf8427e,如果不事先告诉你,那你一辈子都别想得出它的输入信息是 一个空白字符。
二、一些典型的应用。
1. 对一段信息(message)产生信息摘要(message-digest),以防止被篡改。比如,在unix下有很多软件在下载的时候都有一个文件名相同,文件扩展名为.md5的文件,在这个文件中通常只有一行文本,大致结构如:
md5 (tanajiya.tar.gz) = 0ca175b9c0f726a831d895e269332461
这就是tanajiya.tar.gz文件的数字签名。md5将整个文件当作一个大文本信息,通过其不可逆的字符串变换算法,产生了这个唯一的md5信息摘要。如果在以后传播这个文件的过程中, 无论文件的内容发生了任何形式的改变(包括人为修改或者下载过程中线路不稳定引起的传输错误等),只要你对这个文件重新计算md5时就会发现信息摘要不相同,由此可以确定你得到的只是一个不正确的文件。
2.防止抵赖。这需要有第三方权威机构的参与。A 写了个文件,权威机构对改文件用MD5算法产生摘要信息做好记录。若以后A说这文件不是我写的,权威机构只需对改文件重新产生摘要信息跟记录在册的摘要信息进行比对,相同的话,就证明是A写的了。这就是所谓的“数字签名”了。
3. 加密信息。比如在unix系统中用户的密码就是以md5(或其它类似的算法)经加密后存储在文件系统中。当用户登录的时候,系统把用户输入的密码计算成md5值,然后再去和保存在文件系统中的md5值进行比较,进而确定输入的密码是否正确。通过这样的步骤,系统在并不知道用户密码的明码的情况下就可以确定用户登录系统的合法性。这不但可以避免用户的密码被具有系统管理员权限的用户知道,而且还在一定程度上增加了密码被破解的难度。
java安全类库提供了一个java.security.MessageDigest类,此 MessageDigest 类为应用程序提供信息摘要算法的功能,如 MD5 或 SHA 算法。信息摘要是安全的单向哈希函数,它接收任意大小的数据,并输出固定长度的哈希值。有现成的当然是最好的,省事省力。
MD5的非常有实际应用性。有网友给出这样的描述,可以参照一下:http://blog.csdn.net/Daping_Zhang/archive/2005/05/28/382688.aspx
该类的getInstance(String algorithm)
方法返回一个MessageDigest的实体,加密的一系统的digest()
方法和update(byte input)方法。加密后返回一个byte[],16位,我们经常见到很多开源网站的下载地址会有一个[md5]的链接,打开其实就是一小段文本内容。例如:
MD5 (commons-logging-1.1.1-bin.zip) = f88520ed791673aed6cc4591bc058b55
这是Jakarta的logging组件下载时提供的MD5摘要信息,是对这个zip包进行全文加密生成的摘要,摘要码就是后面的f88520ed791673aed6cc4591bc058b55,如果你下载以后,按照MD5的算法生成自己的摘要,如果这二个摘要一样,就证明这个文件是没有被人篡改过的。
遇到的问题是Java的MessageDigest类执行后返回的byte[16]得转换成十六进制的字符串,如果直接用new String(byte[]),得到的结果将是不正确的。算法有很多网友提供了,照搬了。比较有趣的是,commons-logging提供的那个MD5居然和我自己生成的不一样(难道文件被修改过?),后来尝试了其它地方提供的MD5码,都没有问题。
有很多相关的现成代码,搜集了一下整理如下(经过验证):
static Logger logger = Logger.getLogger(MD5Builder.class);
// 用来将字节转换成 16 进制表示的字符
static char hexDigits[] = { '0', '1', '2', '3', '4', '5', '6', '7', '8',
'9', 'a', 'b', 'c', 'd', 'e', 'f' };
/**
* 对文件全文生成MD5摘要
* @param file 要加密的文件
* @return MD5摘要码
*/
public static String getMD5(File file) {
FileInputStream fis = null;
try {
MessageDigest md = MessageDigest.getInstance("MD5");
logger.info("MD5摘要长度:" + md.getDigestLength());
fis = new FileInputStream(file);
byte[] buffer = new byte[2048];
int length = -1;
logger.info("开始生成摘要");
long s = System.currentTimeMillis();
while ((length = fis.read(buffer)) != -1) {
md.update(buffer, 0, length);
}
logger.info("摘要生成成功,总用时: "
+ (System.currentTimeMillis() - s) + "ms");
byte[] b = md.digest();
return byteToHexString(b);
// 16位加密
// return buf.toString().substring(8, 24);
} catch (Exception ex) {
logger.error(ex);
ex.printStackTrace();
return null;
}finally {
try {
fis.close();
} catch (IOException ex) {
ex.printStackTrace();
}
}
}
/**
* 对一段String生成MD5加密信息
* @param message 要加密的String
* @return 生成的MD5信息
*/
public static String getMD5(String message){
try {
MessageDigest md = MessageDigest.getInstance("MD5");
logger.info("MD5摘要长度:" + md.getDigestLength());
byte[] b = md.digest(message.getBytes());
return byteToHexString(b);
} catch (NoSuchAlgorithmException e) {
logger.error(e);
e.printStackTrace();
return null;
}
}
/**
* 把byte[]数组转换成十六进制字符串表示形式
* @param tmp 要转换的byte[]
* @return 十六进制字符串表示形式
*/
private static String byteToHexString(byte[] tmp) {
String s;
// 用字节表示就是 16 个字节
char str[] = new char[16 * 2]; // 每个字节用 16 进制表示的话,使用两个字符,
// 所以表示成 16 进制需要 32 个字符
int k = 0; // 表示转换结果中对应的字符位置
for (int i = 0; i < 16; i++) { // 从第一个字节开始,对 MD5 的每一个字节
// 转换成 16 进制字符的转换
byte byte0 = tmp[i]; // 取第 i 个字节
str[k++] = hexDigits[byte0 >>> 4 & 0xf]; // 取字节中高 4 位的数字转换,
// >>> 为逻辑右移,将符号位一起右移
str[k++] = hexDigits[byte0 & 0xf]; // 取字节中低 4 位的数字转换
}
s = new String(str); // 换后的结果转换为字符串
return s;
}
}