【数据结构】哈希表

一、哈希表

1、介绍

哈希表(hash table),又称散列表,它通过建立键 key 与值 value 之间的映射,实现高效的元素查询。具体而言,我们向哈希表中输入一个键 key ,则可以在 O(1) 时间内获取对应的值 value

除哈希表外,数组和链表也可以实现查询功能,它们的效率对比如表 6-1 所示。

  • 添加元素:仅需将元素添加至数组(链表)的尾部即可,使用 O(1) 时间。

  • 查询元素:由于数组(链表)是乱序的,因此需要遍历其中的所有元素,使用 O(n) 时间。

  • 删除元素:需要先查询到元素,再从数组(链表)中删除,使用 O(n) 时间。

表 6-1 元素查询效率对比

数组 链表 哈希表
查找元素 O(n) O(n) O(1)
添加元素 O(1) O(1) O(1)
删除元素 O(n) O(n) O(1)

观察发现,在哈希表中进行增删查改的时间复杂度都是 O(1) ,非常高效。

2、哈希表常用操作

哈希表的常见操作包括:初始化、查询操作、添加键值对和删除键值对等。

/* 使用C++STL 初始化哈希表 */
 unordered_map<int, string> map;
 ​
 /* 添加操作 */
 // 在哈希表中添加键值对 (key, value)
 map[12836] = "小哈";
 map[15937] = "小啰";
 map[16750] = "小算";
 map[13276] = "小法";
 map[10583] = "小鸭";
 ​
 /* 查询操作 */
 // 向哈希表中输入键 key ,得到值 value
 string name = map[15937];
 ​
 /* 删除操作 */
 // 在哈希表中删除键值对 (key, value)
 map.erase(10583);

哈希表有三种常用的遍历方式:遍历键值对、遍历键和遍历值。

 /* 遍历哈希表 */
 // 遍历键值对 key->value
 for (auto kv: map) 
 {
     cout << kv.first << " -> " << kv.second << endl;
 }
 // 使用迭代器遍历 key->value
 for (auto iter = map.begin(); iter != map.end(); iter++) 
 {
     cout << iter->first << "->" << iter->second << endl;
 }

3、哈希表简单实现

我们先考虑最简单的情况,仅用一个数组来实现哈希表。在哈希表中,我们将数组中的每个空位称为桶(bucket),每个桶可存储一个键值对。因此,查询操作就是找到 key 对应的桶,并在桶中获取 value

那么,如何基于 key 定位对应的桶呢?这是通过哈希函数(hash function)实现的。哈希函数的作用是将一个较大的输入空间映射到一个较小的输出空间。在哈希表中,输入空间是所有 key ,输出空间是所有桶(数组索引)。换句话说,输入一个 key我们可以通过哈希函数得到该 key 对应的键值对在数组中的存储位置

输入一个 key ,哈希函数的计算过程分为以下两步。

  1. 通过某种哈希算法 hash() 计算得到哈希值。

  2. 将哈希值对桶数量(数组长度)capacity 取模,从而获取该 key 对应的数组索引 index

 index = hash(key) % capacity

随后,我们就可以利用 index 在哈希表中访问对应的桶,从而获取 value

 #include <iostream>
 #include <vector>
 using namespace std;
 ​
 /* 键值对 */
 struct Pair {
 public:
     int key;
     string val;
     Pair(int key, string value):key(key),val(value) {}
 };
 ​
 /* 基于数组实现的哈希表 */
 class ArrayHashMap {
 private:
     vector<Pair*> buckets;
 ​
 public:
     ArrayHashMap();
     ~ArrayHashMap();
     int hashFunc(int key);          //哈希函数
     string get(int key);            //查询操作
     void put(int key, string val);  //添加操作
     void remove(int key);           //移除操作
     vector<Pair*> pairSet();        //获取所有键值对
     vector<int> keySet();           //获取所有键
     vector<string> valueSet();      //获取所有值
 ​
 };
 ​
 ArrayHashMap::ArrayHashMap()
 {
     // 初始化数组,包含 100 个桶
     buckets.resize(100);
 }
 ​
 ArrayHashMap::~ArrayHashMap()
 {
     //释放bucket中指针指向的空间
     for (auto bucket : buckets)
     {
         delete bucket;
     }
     buckets.clear();
 }
 ​
 /* 哈希函数 */
 int ArrayHashMap::hashFunc(int key)
 {
     int index = key % 100;
     return index;
 }
 ​
 /* 查询操作 */
 string ArrayHashMap::get(int key)
 {
     int index = hashFunc(key);
     Pair* pair = buckets[index];
     if (pair == nullptr)
     {
         return "";
     }
     return pair->val;
 }
 ​
 /* 添加操作(注意此处没有做哈希冲突处理) */
 void ArrayHashMap::put(int key, string val)
 {
     Pair* pair = new Pair(key, val);
     int index = hashFunc(key);
     buckets[index] = pair;
 }
 ​
 /* 删除操作 */
 void ArrayHashMap::remove(int key)
 {
     int index = hashFunc(key);
     // 释放内存并置为 nullptr
     delete buckets[index];
     buckets[index] = nullptr;
 }
 ​
 /* 获取所有键值对 */
 vector<Pair*> ArrayHashMap::pairSet()
 {
     vector<Pair*> res
哈希表是一种基于哈希函数进行快速查找的数据结构,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。哈希表的设计思路如下: 1. 哈希函数的设计:哈希函数是哈希表的核心,它将关键字映射到哈希表中的位置。一个好的哈希函数应该具有以下特点: - 映射范围广:哈希函数应该将关键字均匀地映射到哈希表中的位置,避免出现大量的哈希冲突。 - 计算速度快:哈希函数的计算速度应该尽可能快,以提高哈希表的访问速度。 - 低冲突率:哈希函数应该尽可能地避免哈希冲突,以提高哈希表的访问效率。 2. 哈希冲突的解决:由于哈希函数的映射范围是有限的,所以不同的关键字可能会映射到同一个位置,这就是哈希冲突。哈希冲突的解决方法有以下两种: - 链地址法:将哈希表中的每个位置都连接一个链表,当发生哈希冲突时,将新的关键字插入到链表的末尾。 - 开放地址法:当发生哈希冲突时,通过某种算法找到哈希表中的下一个空位置,将新的关键字插入到该位置。 3. 哈希表的增删查改操作:哈希表的增删查改操作都需要先通过哈希函数找到关键字在哈希表中的位置,然后再进行相应的操作。具体操作如下: - 插入操作:将新的关键字插入到哈希表中的对应位置,如果发生哈希冲突,则按照链地址法或开放地址法进行解决。 - 删除操作:将关键字从哈希表中对应位置删除,如果该位置上有链表,则需要遍历链表找到对应的关键字进行删除。 - 查找操作:通过哈希函数找到关键字在哈希表中的位置,如果该位置上有链表,则需要遍历链表找到对应的关键字进行查找。 - 修改操作:通过哈希函数找到关键字在哈希表中的位置,如果该位置上有链表,则需要遍历链表找到对应的关键字进行修改。 下面是一个使用链地址法实现的哈希表的Python代码示例: ```python class ListNode: def __init__(self, key=None, value=None): self.key = key self.value = value self.next = None class MyHashMap: def __init__(self): self.size = 1000 self.table = [None] * self.size def _hash(self, key): return key % self.size def put(self, key, value): index = self._hash(key) if not self.table[index]: self.table[index] = ListNode(key, value) else: node = self.table[index] while node: if node.key == key: node.value = value return if not node.next: break node = node.next node.next = ListNode(key, value) def get(self, key): index = self._hash(key) node = self.table[index] while node: if node.key == key: return node.value node = node.next return -1 def remove(self, key): index = self._hash(key) node = prev = self.table[index] if not node: return if node.key == key: self.table[index] = node.next else: node = node.next while node: if node.key == key: prev.next = node.next break node, prev = node.next, prev.next ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值