1. 无序关联容器在存储上组织为一组桶
元素存放在多个桶中,每个桶都有一个索引,每个元素通过哈希函数计算出存放该元素的桶的索引。
例如:
ele1, ele2, ele3 … elen这个n个元素,每个元素将通过哈希函数计算出索引index:
index = hash_fun(ele);
再通过索引找到该元素对应的桶:
bucket = find_buckets(index);
再将元素放到这个桶中:
bucket.add(ele);
注意一个桶可以存放多个元素,因此不同的两个元素计算出相同的哈希值,会导致这两个元素存放在同一个桶中,因此查找一个元素时,计算出哈希值后,可能需要在桶中逐一比较每个元素和这个元素是否相等,从而查找到该元素。(当然也可以有重复的元素比如unordered_multiset,相同的元素也会存放在同一个桶中)
2. c++11 中的无序容器
c++11 中的无序容器类型默认只支持内置类型,包括std::string,指针,以及智能指针,并且有序关联容器支持的函数,无序容器基本都支持,也就是insert、at等函数同样可以使用。
若要支持自定义类型,则需要编写比较运算函数和哈希函数。
哈希函数用于计算桶的下标,比较运算函数用于在同一个桶中查找元素。
(如果元素的类型有相等运算符,则可以不额外提供一个替代相等运算符的函数)
eg:
#include <iostream>
#include <set>
#include <vector>
#include <map>
#include <fstream>
#include <sstream>
#include <unordered_set>
struct Data
{
int first;
int second;
};
// 哈希函数 用于计算元素所属桶的索引 哈希函数决定了元素的存放方式 并且影响容器的性能
std::size_t hasher(const Data& data)
{
return data.first % 5;
}
// 提供元素的==运算 用于在一个“桶”内查找元素
bool eqOp(const Data& ldata, const Data& rdata)
{
return ldata.first == rdata.first;
}
int main()
{
// Data为该容器所保存的类型
// decltype(hasher)* 为哈希函数指针的类型
// decltype(eqOp)* 为==函数指针的类型
// 20为“桶”的大小 hasher为为容器提供的哈希函数 eqOp为为容器提供的==函数
std::unordered_set<Data, decltype(hasher)*, decltype(eqOp)*> unordered_st(20, hasher, eqOp);
Data data;
data.first = 1;
unordered_st.insert(data); // 该元素会插入到索引为1的桶中
data.first = 2;
unordered_st.insert(data); // 该元素会插入到索引为2的桶中
data.first = 12;
unordered_st.insert(data); // 该元素会插入到索引为2的桶中
// bucket_count返回容器有多少个桶
// bucket_size(i)返回第i个桶中有多少个元素
for (int i = 0; i < unordered_st.bucket_count(); ++i) {
std::cout << i << " ";
std::cout << unordered_st.bucket_size(i) << std::endl;
}
// 输出结果表明 第0个桶中有0个元素 第1个桶中有1个元素 第2个桶中有2个元素 其余的桶中没有元素
}
3. 什么情况下使用无序容器
- 当元素不支持比较时,比如没有<运算符
- 无序容器在某些情况下性能可能更好
因为维护元素的序的代价非常高昂,所以发现性能问题时,可尝试用无序容器解决,需要的情况下可自己编写哈希函数和比较运算符