哈希算法(Hash Function)
将任意长度的二进制值串映射为固定长度的二进制值串,这个映射的规则就是哈希算法,而通过原始数据映射之后得到的二进制值串就是哈希值。
构成哈希算法的条件:
从哈希值不能反向推导出原始数据(所以哈希算法也叫单向哈希算法)
对输入数据非常敏感,哪怕原始数据只修改了一个 Bit,最后得到的哈希值也大不相同;
散列冲突的概率要很小,对于不同的原始数据,哈希值相同的概率非常小;
哈希算法的执行效率要尽量高效,针对较长的文本,也能快速地计算出哈希值。
由于其不可逆的特性,hash算法广泛用于数据摘要、密码加密存储以便为每个用户提供安全性。
Hash密码存储结构
大部分密码加密的格式遵循的是OpenBSD密码文件中存储密码时使用的Modular Crypt Format格式:
$1$
: MD5-based crypt ('md5crypt')$2$
: Blowfish-based crypt ('bcrypt')$sha1$
: SHA-1-based crypt ('sha1crypt')$5$
: SHA-256-based crypt ('sha256crypt')$6$
: SHA-512-based crypt ('sha512crypt')
利用hash算法实现的加密技术就有很多种:
MD5 与 SHA-1 算法已被攻破,不应该被用于新的用途;SHA-2 与 SHA-3 还是安全的,可以使用。
SHA-2包括:SHA-224、SHA-256、SHA-384、SHA-512、SHA-512/224、SHA-512/256。
SHA-3包括:SHA3-224、SHA3-256、SHA3-384、SHA3-512。
MD4
MD4(RFC 1320)是 MIT 的 Ronald L. Rivest 在 1990 年设计的,MD 是 Message Digest 的缩写。它适用在32位字长的处理器上用高速软件实现--它是基于 32 位操作数的位操作来实现的,目前已经不被广泛使用 。
MD5
MD5(RFC 1321)是 Rivest 于1991年对MD4的改进版本。它对输入仍以512位分组,其输出是4个32位字的级联,与 MD4 相同。MD5比MD4来得复杂,并且速度较之要慢一点,但更安全,在抗分析和抗差分方面表现更好。
#输入123456,按Ctrl+两次dd,得到其MD5结果值
gaojie@gaojie-H81U:~$ md5sum
123456e10adc3949ba59abbe56e057f20f883e -
#md5(123456) => e10adc3949ba59abbe56e057f20f883e
Bcrypt
bcrypt是由Niels Provos和David Mazières设计的密码哈希函数,他是基于Blowfish cipher密码而来的,并于1999年在USENIX上提出。
一个bcrypt hash的格式如下:
$2[a/b/x/y]$[cost]$[22 character salt][31 character hash]
\__________/-\___/ \_________________/\_________________/
Alg Cost Salt Hash
Alg
:算法的标识符,代表是 bcrypt 的版本,有 2a、2y、2b 三个版本。Cost
:成本因子一般为10,代表轮询加密 2^10 = 1024 次。Salt
: 加盐位,16-byte (128-bit) 的 salt, 用 Radix-64 编码成为 22 个字符。Hash
: Hash位,24-byte (192-bit) 的 hash, 用 Radix-64 编码成为 31 个字符
SHA-256
SHA-2(Secure Hash Algorithm 2),一种散列函数算法标准,由美国国家安全局研发,由美国国家标准与技术研究院(NIST)在2001年发布,属于SHA算法之一,是SHA-1的后继者。其下又分为六个不同的算法标准,包括:SHA-224、SHA-256、SHA-384、SHA-512、SHA-512/224、SHA-512/256。
#输入123456,按Ctrl+两次dd,得到其sha256结果值
gaojie@gaojie-H81U:~$ sha256sum
1234568d969eef6ecad3c29a3a629280e686cf0c3f5d5a86aff3ca12020c923adc6c92 -
#sha256(123456) => e10adc3949ba59abbe56e057f20f883e
参考链接:
常见的hash算法及其原理_哈希算法_Beyond_2016的博客-CSDN博客