抽象容器数据类型
顺序容器:拥有一个单一类型元素组成的一个有序集合。两个主要的顺序容器是 list 和 vector 【第三个顺序容器为双端队列deque,它提供了与 vector 相同的行为,但是对于首元素的有效插入和删除,提供了特殊的支持。】
关联容器:支持查询一个容器是否存在,并且可以有效的获取元素。两个基本的关联容器类型是 map(映射)和 set(集合)。map是一个键/值(key/value)对,键(key)用于查询,而值(value)包含我们希望使用的数据。例如,map可以很好的支持电话目录,键是人名,值是相关联的电话号码。
set包含一个单一键值,有效支持关于元素是否存在的查询。例如,当我们要创建一个单词数据库,且它包含在某个文本中出现的单词时,文本查询系统对能会生成一个单词集合以排除the、and以及but等等。程序将顺次读取文本中的每个单词,检查它是否属于被排除单词的集合,并根据查询的结果将其丢弃或者放入数据库中。
map和set都只包含每个键的惟一出现, 即每个键只允许出现一次。 multimap (多映射)和multiset (多集合)支持同一个键的多次出现。例如,我们的电话目录可能需要为单个用户支持多个列表,一种实现方法是使用multimap。
vector表示一段连续的内存区域,每个元素被顺序存储在这段内存中,对vector的随机访问(比如先访问元素5,然后访问15,然后再访问7等等)效率很高,因为每次访问离vector起始处的位移都是固定的。但是在任意位置,而不是在vector末尾插入元素,则效率很低,因为他需要把待插入元素的右边的每个元素都拷贝一遍。类似的,删除任意一个,而不是vector的最后一个元素,效率同样很低,因为待删除元素右边的每个元素都需要复制一遍。这种代价对于大型的,复杂的类对象来说尤其大。(一个deque也表示一段连续的内存区域,但是与vector不同的是,它支持高效的在其首部插入和删除元素。他通过两级数组结构来实现,一级表示实际的容器,第二级指向容器的首和尾。)
list表示非连续的内存区域,并通过一对指向首尾元素的指针双向连接起来,从而允许向前向后两个方向进行遍历。在list任何位置插入和删除的效率都很高:指针必须被重新赋值,但是,不需要用拷贝元素来实现移动。另一方面,他对随机访问的支持并不太好:访问一个元素需要遍历中间的元素。另外每个元素还有两个指针的额外空间开销。
下面是选择顺序容器的一些准则:
- 如果我们需要随机访问一些容器,则 vector 要比 list 好很多。
- 如果我们已知要存储元素的个数,则 vector 又是一个比 list 好很多的选择。
- 如果我们需要的不只是在容器两端插入和删除元素,则 list 显然要比 vector 好。
- 除非我们需要在容器首部插入和删除元素,否则 vector 要比 deque 好。