前言
我们都知道哈希set,也就是STL中的unordered_set容器,他非常方便,能够在O(1)的时间内完成查询,有一次我在做作业的时候,却发现实际效果没那么好。
问题大概是这样的,有一个图,每个节点都有一些不同的属性,要查找那些节点具有特定的属性,我使用哈希set来存储属性,结果和线性表差不多
然后我猜想是规模太小的时候就用unordered_set的问题,其实就是这个问题,我知道的,只是不知道这个问题的边界在哪里 ,即多少规模下,顺序查找快。
今天来测试一下unordered_set和顺序查找,不同规模下的速度,方便以后选取容器。
哈希set简单介绍
unordered_set 通过一个哈希函数,将对象的值映射到一个数组下标,这个数组下标对应的是unordered_set中的一个“桶”,表示所有可以映射到这个下标的元素的集合,通常用链表表示。
我们举一个简单的例子来表示这种规则:假设我们通过 x%7 来得到桶的下标,也就是哈希函数为 x%7
哈希set vs 线性查找
一句话:
顺序查找即按照顺序在数组中遍历直到找到或者到数组结尾,复杂度为O(n)
哈希set是先通过哈希函数找到“桶”的下标,然后再在桶中顺序查找元素。如果元素分布均匀的话,均摊复杂度是O(1)。
我们知道哈希set底层代码较多,所以小规模下,效率肯定没有顺序查找快。今天我们来测试这个规模出来,方便以后面对不同问题,选择不同查找方式。
测试代码
我们随机创建一个数组和一个哈希set,然后测试查找的时间。
#include <bits/stdc++.h>
using namespace std;
int main()
{
double t1, t2;
clock_t st, ed;
#define batch 1000
#define query_num 1000
int n=50, t