说明:大量内容参考OIWIKI
Part1.引入
pb_ds 库全称 Policy-Based Data Structures。
pb_ds 库封装了很多数据结构,比如哈希(Hash)表,平衡二叉树,字典树(Trie 树),堆(优先队列)等。
就像 vector、set、map 一样,其组件均符合 STL 的相关接口规范。部分(如优先队列)包含 STL 内对应组件的所有功能,但比 STL 功能更多。
pb_ds 只在使用 libstdc++ 为标准库的编译器下可以用。
引入方法:
#include <ext/pb_ds/assoc_container.hpp>
#include <ext/pb_ds/tree_policy.hpp> // 引入平衡树
#include <ext/pb_ds/hash_policy.hpp> // 引入hash
#include <ext/pb_ds/trie_policy.hpp> // 引入trie
#include <ext/pb_ds/priority_queue.hpp> // 引入priority_queue
using namespace __gnu_pbds;
更为简洁的引入方式:
#include <bits/extc++.h> //直接全部淦进来
using namespace __gnu_pbds;
Part2.用法
(1).平衡树:Tree
要求引入头文件:
#include <ext/pb_ds/assoc_container.hpp>
#include <ext/pb_ds/tree_policy.hpp>
using namespace __gnu_pbds;
构造方式:
template <
typename Key,
typename Mapped,
typename Cmp_Fn = std::less<Key>,
typename Tag = rb_tree_tag,
template<
typename Const_Node_Iterator,
typename Node_Iterator,
typename Cmp_Fn_,
typename Allocator_>
class Node_Update = null_tree_node_update,
typename Allocator = std::allocator<char>> class tree;
模板形参:
Key: 储存的元素类型,如果想要存储多个相同的Key元素,则需要使用类似于std::pair和struct的方法,并配合使用lower_bound和upper_bound成员函数进行查找Mapped: 映射规则(Mapped-Policy)类型,如果要指示关联容器是 集合,类似于存储元素在std::set中,此处填入null_type,低版本g++此处为null_mapped_type;如果要指示关联容器是 带值的集合,类似于存储元素在std::map中,此处填入类似于std::map<Key, Value>的Value类型Cmp_Fn: 关键字比较函子,例如std::less<Key>Tag: 选择使用何种底层数据结构类型,默认是rb_tree_tag。__gnu_pbds提供不同的三种平衡树,分别是:rb_tree_tag:红黑树,[一般使用这个],后两者的性能一般不如红黑树,容易被卡splay_tree_tag:splay 树ov_tree_tag:有序向量树,只是一个由vector实现的有序结构,类似于排序的vector来实现平衡树,性能取决于数据想不想卡你
Node_Update:用于更新节点的策略,默认使用null_node_update,若要使用order_of_key和find_by_order方法,需要使用tree_order_statistics_node_update(该方法是在统计子树的 s i z e size size)Allocator:空间分配器类型
成员函数:
insert(x):向树中插入一个元素 x,返回std::pair<point_iterator, bool>。erase(x):从树中删除一个元素/迭代器 x,返回一个bool表明是否删除成功。order_of_key(x):返回 x 以Cmp_Fn比较的排名。find_by_order(x):返回Cmp_Fn比较的排名所对应元素的迭代器。lower_bound(x):以Cmp_Fn比较做lower_bound,返回迭代器。upper_bound(x):以Cmp_Fn比较做upper_bound,返回迭代器。join(x):将 x 树并入当前树,前提是两棵树的类型一样,x 树被删除。split(x,b):以Cmp_Fn比较,小于等于 x 的属于当前树,其余的属于 b 树。empty():返回是否为空。size():返回大小。
自义定Node_update
template <class Node_CItr, class Node_Itr, class Cmp_Fn, class _Alloc>
struct my_node_update {
virtual Node_CItr node_begin() const = 0;
virtual Node_CItr node_end() const = 0;
typedef int metadata_type; // metadata type: 是指节点上记录的额外信息的类型
// operator() 的功能是将节点it的信息更新为其左右儿子的信息之和,传入的end_it表示空节点
// it 是Node_Iter, 用星号进行取值后变为iterator, -> second即为该节点的mapped_value
inline void operator()(Node_Itr it, Node_CItr end_it) {
Node_Itr l = it.get_l_child(), r = it.get_r_child();
int left = 0, right = 0;
if(l != end_it) left = l.get_metadata();
if(r != end_it) right = r.get_metadata();
const_cast<metadata_type &>(it.get_metadata()) = left + right + 1;
}
inline int order_of_key(pair<int, int> x) {
int ans = 0;
Node_CItr it = node_begin();
while(it != node_end()) {
Node_CItr l = it.get_l_child();
Node_CItr r = it.get_r_child();
if(Cmp_Fn()(x, **it)) it = l;
else {
ans++;
if(l != node_end()) ans += l.get_metadata();
it = r;
}
}
return ans;
}
};
tree<pair<int, int>, null_type, less<pair<int, int>>, rb_tree_tag, my_node_update> tr;
(2).字典树 Trie
要求引入头文件
#include <ext/pb_ds/assoc_container.hpp>
#include <ext/pb_ds/trie_policy.hpp>
using namespace __gnu_pbds;
构造方式以及使用方法
typedef trie<string,null_type,trie_string_access_traits<>,pat_trie_tag,trie_prefix_search_node_update> tr;
//第一个参数必须为字符串类型,tag也有别的tag,但pat最快,与tree相同,node_update支持自定义
tr.insert(s); //插入s
tr.erase(s); //删除s
tr.join(b); //将b并入tr
pair//pair的使用如下:
pair<tr::iterator,tr::iterator> range=base.prefix_range(x);
for(tr::iterator it=range.first;it!=range.second;it++) cout<<*it<<' '<<endl;
//pair中第一个是起始迭代器,第二个是终止迭代器,遍历过去就可以找到所有字符串了。
(3).哈希表 HashTable
要求引入头文件
#include <ext/pb_ds/assoc_container.hpp>
#include <ext/pb_ds/hash_policy.hpp> // 引入hash
using namespace __gnu_pbds;
使用方法
cc_hash_table<int, bool> h; // 拉链法
gp_hash_table<int, bool> h; // 探测法(推荐)
其余方法同std::map,但是注意,该数据结构的总复杂度是
O
(
N
)
O(N)
O(N)。
(4).堆 Priority_queue
#include <ext/pb_ds/priority_queue.hpp>
using namespace __gnu_pbds;
__gnu_pbds ::priority_queue<T, Compare, Tag, Allocator>
模板形参
T: 储存的元素类型Compare: 提供严格的弱序比较类型Tag: 是__gnu_pbds提供的不同的五种堆,Tag 参数默认是pairing_heap_tag五种分别是:pairing_heap_tag:配对堆
官方文档认为在非原生元素(如自定义结构体/std :: string/pair) 中,配对堆表现最好binary_heap_tag:二叉堆
官方文档认为在原生元素中二叉堆表现最好,不过我测试的表现并没有那么好binomial_heap_tag:二项堆
二项堆在合并操作的表现要优于二叉堆,但是其取堆顶元素操作的复杂度比二叉堆高rc_binomial_heap_tag:冗余计数二项堆thin_heap_tag:除了合并的复杂度都和 Fibonacci 堆一样的一个 tagAllocator:空间配置器,由于 OI 中很少出现,故这里不做讲解
由于本篇文章只是提供给学习算法竞赛的同学们,故对于后四个 tag 只会简单的介绍复杂度,第一个会介绍成员函数和使用方法。
经作者本机 Core i5 @3.1 GHz On macOS 测试堆的基础操作,结合 GNU 官方的复杂度测试,Dijkstra 测试,都表明:
至少对于 OIer 来讲,除了配对堆的其他四个 tag 都是鸡肋,要么没用,要么常数大到不如 std 的,且有可能造成 MLE,故这里只推荐用默认的配对堆。同样,配对堆也优于 algorithm 库中的 make_heap()。
构造方式
要注明命名空间因为和 std 的类名称重复。
__gnu_pbds ::priority_queue<int> __gnu_pbds::priority_queue<int, greater<int> >
__gnu_pbds ::priority_queue<int, greater<int>, pairing_heap_tag>
__gnu_pbds ::priority_queue<int>::point_iterator id; // 点类型迭代器
// 在 modify 和 push 的时候都会返回一个 point_iterator,下文会详细的讲使用方法
id = q.push(1);
成员函数
push(): 向堆中压入一个元素,返回该元素位置的迭代器。pop(): 将堆顶元素弹出。top(): 返回堆顶元素。size()返回元素个数。empty()返回是否非空。modify(point_iterator, const key): 把迭代器位置的key修改为传入的key,并对底层储存结构进行排序。erase(point_iterator): 把迭代器位置的键值从堆中擦除。join(__gnu_pbds :: priority_queue &other): 把other合并到*this并把other清空。
使用的 tag 决定了每个操作的时间复杂度:
| push | pop | modify | erase | Join | |
|---|---|---|---|---|---|
pairing_heap_tag | O ( 1 ) O(1) O(1) | 最坏 Θ ( n ) \Theta(n) Θ(n) 均摊 Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) | 最坏 Θ ( n ) \Theta(n) Θ(n) 均摊 Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) | 最坏 Θ ( n ) \Theta(n) Θ(n) 均摊 Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) | O ( 1 ) O(1) O(1) |
binary_heap_tag | 最坏 Θ ( n ) \Theta(n) Θ(n) 均摊 Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) | 最坏 Θ ( n ) \Theta(n) Θ(n) 均摊 Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) | Θ ( n ) \Theta(n) Θ(n) | Θ ( n ) \Theta(n) Θ(n) | Θ ( n ) \Theta(n) Θ(n) |
binomial_heap_tag | 最坏 Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) 均摊 O ( 1 ) O(1) O(1) | Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) | Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) | Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) | Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) |
rc_binomial_heap_tag | O ( 1 ) O(1) O(1) | Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) | Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) | Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) | Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) |
thin_heap_tag | O ( 1 ) O(1) O(1) | 最坏 Θ ( n ) \Theta(n) Θ(n) 均摊 Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) | 最坏 Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) 均摊 O ( 1 ) O(1) O(1) | 最坏 Θ ( n ) \Theta(n) Θ(n) 0 均摊 Θ ( log ( n ) ) \Theta(\log(n)) Θ(log(n)) | Θ ( n ) \Theta(n) Θ(n) |
示例
#include <algorithm>
#include <cstdio>
#include <ext/pb_ds/priority_queue.hpp>
#include <iostream>
using namespace __gnu_pbds;
// 由于面向OIer, 本文以常用堆 : pairing_heap_tag作为范例
// 为了更好的阅读体验,定义宏如下 :
#define pair_heap __gnu_pbds ::priority_queue<int>
pair_heap q1; // 大根堆, 配对堆
pair_heap q2;
pair_heap ::point_iterator id; // 一个迭代器
int main() {
id = q1.push(1);
// 堆中元素 : [1];
for (int i = 2; i <= 5; i++) q1.push(i);
// 堆中元素 : [1, 2, 3, 4, 5];
std ::cout << q1.top() << std ::endl;
// 输出结果 : 5;
q1.pop();
// 堆中元素 : [1, 2, 3, 4];
id = q1.push(10);
// 堆中元素 : [1, 2, 3, 4, 10];
q1.modify(id, 1);
// 堆中元素 : [1, 1, 2, 3, 4];
std ::cout << q1.top() << std ::endl;
// 输出结果 : 4;
q1.pop();
// 堆中元素 : [1, 1, 2, 3];
id = q1.push(7);
// 堆中元素 : [1, 1, 2, 3, 7];
q1.erase(id);
// 堆中元素 : [1, 1, 2, 3];
q2.push(1), q2.push(3), q2.push(5);
// q1中元素 : [1, 1, 2, 3], q2中元素 : [1, 3, 5];
q2.join(q1);
// q1中无元素,q2中元素 :[1, 1, 1, 2, 3, 3, 5];
}
__gnu_pbds 迭代器的失效保证(invalidation_guarantee)
在上述示例以及一些实践中(如使用本章的 pb-ds 堆来编写单源最短路等算法),常常需要保存并使用堆的迭代器(如 __gnu_pbds::priority_queue<int>::point_iterator 等)。
可是例如对于 __gnu_pbds::priority_queue 中不同的 Tag 参数,其底层实现并不相同,迭代器的失效条件也不一样,根据__gnu_pbds 库的设计,以下三种由上至下派生的情况:
-
基本失效保证(basic_invalidation_guarantee):即不修改容器时,点类型迭代器(point_iterator)、指针和引用(key/value)保持 有效。
-
点失效保证(point_invalidation_guarantee):即 修改 容器后,点类型迭代器(point_iterator)、指针和引用(key/value)只要对应在容器中没被删除 保持 有效。
-
范围失效保证(range_invalidation_guarantee):即 修改 容器后,除(2)的特性以外,任何范围类型的迭代器(包括
begin()和end()的返回值)是正确的,具有范围失效保证的 Tag 有 rb_tree_tag 和 适用于__gnu_pbds::tree的 splay_tree_tag(),以及 适用于__gnu_pbds::trie的 pat_trie_tag。
从运行下述代码中看出,除了 binary_heap_tag 为 basic_invalidation_guarantee 在修改后迭代器会失效,其余的均为 point_invalidation_guarantee 可以实现修改后点类型迭代器 (point_iterator) 不失效的需求。
#include <bits/stdc++.h>
using namespace std;
#include <ext/pb_ds/assoc_container.hpp>
#include <ext/pb_ds/priority_queue.hpp>
using namespace __gnu_pbds;
#include <cxxabi.h>
template <typename T>
void print_invalidation_guarantee() {
typedef typename __gnu_pbds::container_traits<T>::invalidation_guarantee gute;
cout << abi::__cxa_demangle(typeid(gute).name(), 0, 0, 0) << endl;
}
int main() {
typedef
typename __gnu_pbds::priority_queue<int, greater<int>, pairing_heap_tag>
pairing;
typedef
typename __gnu_pbds::priority_queue<int, greater<int>, binary_heap_tag>
binary;
typedef
typename __gnu_pbds::priority_queue<int, greater<int>, binomial_heap_tag>
binomial;
typedef typename __gnu_pbds::priority_queue<int, greater<int>,
rc_binomial_heap_tag>
rc_binomial;
typedef typename __gnu_pbds::priority_queue<int, greater<int>, thin_heap_tag>
thin;
print_invalidation_guarantee<pairing>();
print_invalidation_guarantee<binary>();
print_invalidation_guarantee<binomial>();
print_invalidation_guarantee<rc_binomial>();
print_invalidation_guarantee<thin>();
return 0;
}
(5).可持久化数组/可持久化平衡树/块状链表 rope
要求引入头文件
#include <ext/rope>
using namespace __gnu_cxx;
使用方法
// 定义:
rope<int> rp;
成员函数
-
push_back(x): 在末尾插入 x x x -
insert(pos, x): 在 p o s pos pos处插入 x x x -
erase(pos, x): 在 p o s pos pos处删除 x x x个元素 -
length(): 返回数组长度 -
size(): 返回数组长度(同上) -
replace(pos, x): 将 p o s pos pos处元素替换为 x x x -
substr(pos, x, s): 从 p o s pos pos处开始提取 x x x个元素 -
copy(pos, x, s): 从 p o s pos pos处开始复制 x x x个元素到 s s s中 -
at(x): 访问第 x x x个元素,同rp[x]
rope 内部是块状链表实现的,黑科技是支持
O
(
1
)
O(1)
O(1) 复制,而且不会空间爆炸 (rope 是平衡树,拷贝时只拷贝根节点就行)。因此可以用来做可持久化数组。
拷贝历史版本的方式:
rope<int> *his[100000];
his[i] = new rope<int> (*his[i - 1]);
234

被折叠的 条评论
为什么被折叠?



