【算法】散列表

最新推荐文章于 2021-07-05 15:08:51 发布

dengbeng4485

最新推荐文章于 2021-07-05 15:08:51 发布

阅读量201

点赞数

文章标签：数据结构与算法 python

原文链接：http://www.cnblogs.com/lilip/p/9528833.html

版权

散列表

散列函数

定义

散列函数“将输入映射到数字”。即无论你给它什么数据，它都还你一个数字。

散列函数必须满足一些要求

l 它必须是一致的。例如，假设你输入apple时得到的是4，那么每次输入apple时，得到的都必须为4。

l 它应将不同的输入映射到不同的数字。例如，如果一个散列函数不管输入是什么都返回1，它就不是好的散列函数。最理想的情况是，将不同的输入映射到不同的数字。

散列函数准确地指出了存储位置，具体原因如下：

l 散列函数总是将同样的输入映射到相同的索引。

l 散列函数将不同的输入映射到不同的索引。

l 散列函数知道数组有多大，只返回有效的索引。

散列表

l 使用散列函数和数组创建了一种被称为散列表（hashtable）的数据结构。

l 散列表是一种包含额外逻辑的数据结构。数组和链表都被直接映射到内存，但散列表更复杂，它使用散列函数来确定元素的存储位置。

l 散列表也使用数组来存储数据，因此其获取元素的速度与数组一样快

python使用字典来实现散列表功能，可使用函数dict创建散列表

应用

将散列表用于查找

示例：

l 创建映射。

l 查找。

>>> phonebook={}
>>> phonebook['li']=123456
>>> phonebook['p']=987654
>>> print(phonebook['p'])
987654

防止重复

示例：检查是否存在某个元素

voted={}
def check_voter(name):
    if voted.get(name):              #使用函数get来返回是否存在。不存在返回None
        print('kick them out!')
    else:
        voted[name]=True
        print('let them vote')
 
check_voter('tom')

check_voter('jerry')

check_voter('jerry')

将散列表用作缓存

缓存的工作原理：网站将数据记住，而不再重新计算。

缓存优点

l 用户能够更快地看到网页

l 需要做的工作更少。

缓存是一种常用的加速方式，所有大型网站都使用缓存，而缓存的数据则存储在散列表中！

访问过程

cache={}
def get_page(url):
    if cache.get(url):                  　　　　　 #检查缓存中是否存储了该页面
        return cache[url]                  　　　　#存储了，即返回它
    else:
        data=get_data_from_server(url)            #没存储，从服务器调用
        cache[url]=data                           #将其存储到缓存中
        return data                               #返回该页面