什么是Hash哈希(散列表)
相信学计算机的各位都绝对听过Hash哈希(散列表),有些人认为Hash是一种算法,有人认为它是一种数据结构,其实这些说法都不算太准确.其实hash是一类算法的集合,或者说是一种算法思想
定义
-
Baidu:Hash,一般翻译做散列、杂凑,或音译为哈希,是把任意长度的输入(又叫做预映射pre-image)通过散列算法变换成固定长度的输出,该输出就是散列值。
-
Wikipedia:A hash function is any function that can be used to map data of arbitrary size to fixed-size values. (一个哈希函数就是一个能把任意长度的数据映射到固定长度的值的函数)
可以看出百度百科和维基的定义十分相似,提炼出来就是hash就是把任意长度的数据变成固定长度的数据.而且维基百科的定义还说了,只要一个函数能做这件事,它就是hash哈希函数. 这就能充分说明上文的观点.
哈希函数
一个符合hash哈希思想的函数.常见的hash函数有:
- 直接寻址:取关键字或关键字的某个线性函数值为散列地址
- 数字分析法:分析一组数据找出数字的规律,尽可能利用这些数据来构造冲突几率较低的散列地址。
- 平方取中法:取关键字平方后的中间几位作为散列地址。
性质
- Hash值相同,两者的原始输入不一定相同
- Hash值不同,两者的原始输入一定不同,因为会产生’冲突’
- Hash算法通常是把长的输入变成短的输出
- Hash算法是不可逆的,也就是说你可以用原始输入通过Hash函数获得Hash值,但是你不能通过Hash值来获得原始输入
作用
- 文件校验
- 数字签名
- 文件压缩