如果查找速度很重要,那么考虑非标准的散列容器总是值得的,通过适当的散列函数,散列容器基本能提供常数时间的查找能力。对于许多应用,散列容器可能提供的常数时间查找能力优于set、mutiset、map、multimap的确定的对数时间的查找能力。
标准关联容器采用的结构为平衡二叉树结构。
很多程序员使用数据结构分为3个顺序:
- 建立。通过插入很多元素建立一个新的数据结构。在这个阶段,几乎所有的操作都是插入和删除。几
乎没有或根本没有查找。 - 查找。在数据结构中查找指定的信息片。在这个阶段,几乎所有的操作都是查找。几乎没有或根本没
有插入和删除。 - 重组。修改数据结构的内容,也许通过删除所有现有数据和在原地插入新数据。从动作上说,这个阶
段等价于阶段1。一旦这个阶段完成,应用程序返回阶段2。
概要:在有序vector中存储数据很有可能比在标准关联容器中保存相同的数据消耗更少的内存;当页面错误
值得重视的时候,在有序vector中通过二分法查找可能比在一个标准关联容器中查找更快。
#include<iostream>
#include<map>
#include<set>
#include<vector>
#include<algorithm>
#include<iterator>
using namespace std;
typedef pair<string, int> Data;//假设存储在map中的类型也为<string,int>
bool keyLess(string a, string b)
{
return a < b;
}
//当对vector排序时,需要为自己的pair写一个自定义的比较函数,因为pair的operator<对pair的两部分都做比较
//有趣的是,用来排序的比较函数需要两个pair对象作为参数,但是查找的时候只需要一个键值
//因此,用于查找的比较函数必须用带一个与键值同类型的对象和一个pair的对象作为参数
class DataCompare
{
public:
DataCompare();
~DataCompare();
//下边的3个函数都是基于比较的函数
bool operator()(const Data& lhs, const Data& rhs) const
{
return keyLess(lhs.first, rhs.first);
}
bool operator()(const Data& lhs, const Data::first_type& k)
{
return keyLess(lhs.first, k);
}
bool operator()(const Data::first_type& k, const Data& rhs)
{
return keyLess(k, rhs.first);
}
private:
//下边的函数是“实际”的比较函数
bool operator()(const Data::first_type& k1, const Data::first_type& k2)
{
return keyLess(k1, k2);
}
};
DataCompare::DataCompare()
{
}
DataCompare::~DataCompare()
{
}
int main()
{
//下面试用vector作为映像表的主要流程
//把vector作为映像表来使用,实质上相当于用它做一个集合一样,唯一的区别是,需要用
//DataCompare作为比较对象
vector<Data> vd;//取代map<string,int>
//设置阶段:大量的插入,查找却很少
sort(vd.begin(), vd.end());//设置阶段结束
string s;
//开始查找阶段
if (binary_search(vd.begin(), vd.end(), s, DataCompare()));
//通过binary_search查找
vector<Data>::iterator i = lower_bound(vd.begin(), vd.end(), s, DataCompare());
if (i != vd.end() && !DataCompare()(s, *i));
//......
pair<vector<Data>::iterator, vector<Data>::iterator> range\
= equal_range(vd.begin(), vd.end(), s, DataCompare());
if (range.first != range.second);//结束查找阶段,开始重组阶段
sort(vd.begin(), vd.end(), DataCompare());//开始新的查找阶段
return 0;
}
上边使用方法的前提是,使用数据结构的方式符合开始提到的3个阶段,如果不符合,那么使用排序的vector而不是标准关联容器几乎肯定是在浪费时间。