最近开始学习王争老师的《数据结构与算法之美》,通过总结再加上自己的思考的形式记录这门课程,文章主要作为学习历程的记录。
哈希算法的定义是将任意长度的二进制值串映射为固定长度的二进制值串。这个映射规则就是哈希算法。通过原始数据映射后得到的二进制值串就是哈希值。设计一个优秀的哈希算法应满足几点要求:
1.从哈希值不能反向推导出原始数据(因此哈希算法也叫单向哈希算法)。
2.对输入数据非常敏感,哪怕原始数据只修改了一个Bit,最后得到的哈希值也大不相同。
3.散列冲突的概率要很小,对于不同的原始数据,哈希值相同的概率非常小。
4.哈希算法的执行效率要尽量高效,针对较长的文本,也能快速计算出哈希值。
举个例子,
MD5(“今天我来讲哈希算法”) = bb4767201ad42c74e650c1b6c03d78fa
MD5(“jiajia”) = cd611a31ea969b908932d44d126d195b
可以看出,无论哈希的文本有多长,多短,通过MD5哈希之后,得到的哈希值长度是相同的,而且得到的哈希值看起来像是一堆随机数,毫无规律,也很难根据哈希值反推回对应的文本。
哈希算法的应用非常非常多,作者选了最常见的7个,分别是安全加密、唯一标识、数据校验、散列函数、负载均衡、数据分片和分布式存储。
应用一:安全加密
最常用于加密的哈希算法是MD5(MD5消息摘要算法)和SHA(安全散列算法)。除此之外,还有其他加密算法,比如DES(数据加密算法)、A