参考 https://www.zhihu.com/question/26762707
https://www.zhihu.com/question/26762707/answer/40119521
hash(散列、杂凑)函数,是将任意长度的数据映射到有限长度的域上。
为什么MD5说是128位,却只有32个字符?这是因为这两个长度的概念不同;
通常MD5(不止MD5,其它例如sha1、sha256)等hash值通常都是以十六进制表示的,而其内部算法使用的是二进制;
以MD5值为例:e10adc3949ba59abbe56e057f20f883e
用十六进制表示时,使用了32个16进制数;而一个16进制数用二进制表示时,需要占用4位;所以是128个比特位
在密码学中,hash算法的作用主要是用于消息摘要和签名,换句话说,它主要用于对整个消息的完整性进行校验。举个例子,我们登陆知乎的时候都需要输入密码,那么知乎如果明文保存这个密码,那么黑客就很容易窃取大家的密码来登陆,特别不安全。那么知乎就想到了一个方法,使用hash算法生成一个密码的签名,知乎后台只保存这个签名值。
由于hash算法是不可逆的,那么黑客即便得到这个签名,也丝毫没有用处;而如果你在网站登陆界面上输入你的密码,那么知乎后台就会重新计算一下这个hash值,与网站中储存的原hash值进行比对,如果相同,证明你拥有这个账户的密码,那么就会允许你登陆。银行也是如此,银行是万万不敢保存用户密码的原文的,只会保存密码的hash值而而已。
在这些应用场景里,对于抗碰撞和抗篡改能力要求极高,对速度的要求在其次。一个设计良好的hash算法,其抗碰撞能力是很高的。