基本概念
映射:
dict即字典,是python语言中重要的数据结构,在其中每一个唯一的关键字(键)都被映射到对应的值上。
故将字典所表示的键和值之间的关系,通常称之为关联数组或者映射。如下图:
my_dict={"name":"张三","age":21}
#添加
my_dict["性别"]="女"
print(my_dict)
print(my_dict['name'])#给定键,通过映射找到索引
{'name': '张三', 'age': 21, '性别': '女'}
张三
从上面可知,字典重要的是键和值之间的映射关系,确保每次映射都能产生唯一的索引,理解这一点,下面的概念就很容易理解了。
哈希函数
哈希函数的目标就是将每个键映射到[0,N-1]区间内的整数,其中N是存储的大小。
- 普通数组来说,关键字k映射到list[k],即可得到元素
- 对哈希函数h()来说,关键字k映射到映射到dict[h(k)],才能得到元素。
哈希函数分解:
哈希函数一般由:哈希码和压缩函数组成。
- 一个哈希码,将一个键映射到一个整数,
- 压缩函数,将上面的整数映射到,数组的容量范围内[0,N-1]。
之所以分为两部分,优点是:
- 哈希码的计算独于数组的容量大小N,这样就可以为每个对象开发一个通用的哈希码,只有压缩函数与数组的容量有关。
哈希冲突
哈希冲突就是,就是在哈希函数在对不同的键映射的时候产生的映射结果是相同的,有两种哈希冲突:
- 键通过映射后,哈希码是一样的,则通过压缩函数后,结果也是一样的。
- 两个哈希码通过压缩函数后,产生的结果是一样,即索引是一样的。
哈希冲突解决方案
分离链表:
线性探测:
第一种:发生冲突时,一次向后寻找空的地方,保存数据。
第二种,和第一中类似,只是向后寻找的步伐更大一点,f(i) = i^2,