import java.io.BufferedInputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.zip.CRC32;
import java.util.zip.CheckedInputStream;
import org.junit.Test;
public class CRCTest {
@Test
public void testFileCRC() {
try {
System.out.println(getCRC32("C:\\software.xml"));
System.out.println(checksumBufferedInputStream("C:\\software.xml"));
} catch (IOException e) {
e.printStackTrace();
}
}
/**
* 采用BufferedInputStream的方式加载文件
*/
public static long checksumBufferedInputStream(String filepath) throws IOException {
InputStream inputStream = new BufferedInputStream(new FileInputStream(filepath));
CRC32 crc = new CRC32();
byte[] bytes = new byte[1024];
int cnt;
while ((cnt = inputStream.read(bytes)) != -1) {
crc.update(bytes, 0, cnt);
}
inputStream.close();
return crc.getValue();
}
/**
* 使用CheckedInputStream计算CRC
*/
public static Long getCRC32(String filepath) throws IOException {
CRC32 crc32 = new CRC32();
FileInputStream fileinputstream = new FileInputStream(new File(filepath));
CheckedInputStream checkedinputstream = new CheckedInputStream(fileinputstream, crc32);
while (checkedinputstream.read() != -1) {
}
checkedinputstream.close();
return crc32.getValue();
}
}
php中CRC32的用法:
crc32 — 计算一个字符串的 crc32 多项式
生成 string 参数的 32 位循环冗余校验码多项式……: 这句话从英文翻译过来的,不正确,准确的说应该是这么理解: 以32位循环冗余校验多项式算法,来计算一个字符串,返回一个(可能带符号的)整数。 使用方法: 这个函数的功能类似于md5算法、sha1算法加密。这个函数的使用过程中,需要多考虑取返回的整数的绝对值就可以了。 至于如何能做到检查传输的数据是否完整: 参考md5的常见使用场景。 32位循环冗余校验多项式:这个是一个数学算法,在php的源码内可以看到。你可以当作他是一个md5算法的数字版。
经常有人问,说CRC、MD5、SHA1都是计算一个校验值的,到底有何区别
相同点:
CRC、MD5、SHA1都是通过对数据进行计算,来生成一个校验值,该校验值用来校验数据的完整性。
不同点:
1. 算法不同。CRC采用多项式除法,MD5和SHA1使用的是替换、轮转等方法;
2. 校验值的长度不同。CRC校验位的长度跟其多项式有关系,一般为16位或32位;MD5是16个字节(128位);SHA1是20个字节(160位);
3. 校验值的称呼不同。CRC一般叫做CRC值;MD5和SHA1一般叫做哈希值(Hash)或散列值;
4. 安全性不同。这里的安全性是指检错的能力,即数据的错误能通过校验位检测出来。CRC的安全性跟多项式有很大关系,相对于MD5和SHA1要弱很多;MD5的安全性很高,不过大概在04年的时候被山东大学的王小云破解了;SHA1的安全性最高。
5. 效率不同,CRC的计算效率很高;MD5和SHA1比较慢。
6. 用途不同。CRC一般用作通信数据的校验;MD5和SHA1用于安全(Security)领域,比如文件校验、数字签名等。
以下是我从其他地方找的总结:
MD5可靠性
首先是不可逆
其次,这个码具有高度的离散性,也就是说,原信息的一点点变化就会导致MD5的巨大变化,
最后由于这个码有128位那么长,所以任意信息之间具有相同MD5码的可能性非常之低,通常被认为是不可能的。
crc比较短,md5比较长
所以md5相对来说冲突的可能性要小很多
如果要求不高,是防范传输误码之类的用crc就可以了,crc效率要高很多
如果要防范人为恶意破坏,需要用md5,慢就慢点,图个可靠性加强
本文详细对比了CRC32与MD5两种校验算法的特点及应用场合,包括算法原理、校验值长度、安全性、效率和用途等方面,帮助读者理解两者之间的区别。

被折叠的 条评论
为什么被折叠?



