概述:
set/multiset容器的特性:
- 1)set/multiset的特性是所有元素会根据元素的值自动进行排序。set是以RB-tree(红黑树,属于平衡二叉树的一种,而平衡二叉树是属于二叉树的一种)为底层机制,其查找效率非常好。set容器中不允许重复元素,multiset允许重复元素。
树的相关概念
-
1)二叉树:二叉树就是任何节点最多只允许有两个字节点。分别是左子结点和右子节点。
-
2)二叉搜索树:是指二叉树中的节点按照一定的规则进行排序,使得对二叉树中元素访问更加高效。二叉搜索树的放置规则是:任何节点的元素值一定大于其左子树中的每一个节点的元素值,并且小于其右子树的值。因此从根节点一直向左走,一直到无路可走,即得到最小值,一直向右走,直至无路可走,可得到最大值。那么在儿茶搜索树中找到最大元素和最小元素是非常简单的事情。下图为二叉搜索树:
-
3)平衡二叉树:上面我们介绍了二叉搜索树,那么当一个二叉搜索树的左子树和右子树不平衡的时候,那么搜索依据上图表示,搜索9所花费的时间要比搜索17所花费的时间要多,由于我们的输入或者经过我们插入或者删除操作,二叉树失去平衡,造成搜索效率降低。
所以我们有了一个平衡二叉树的概念,所谓的平衡不是指的完全平衡。
-
4)RB-tree(红黑树):红黑树是二叉树的一种,由于红黑树比较复杂,这里不列举,大家学习红黑树时可以记住它几个性质即可。而这里的set/multiset就是红黑树实现的。
下面给出关于平衡二叉树和哈夫曼树的相关详细文章。
https://blog.csdn.net/weixin_44517656/article/details/105186876 //平衡二叉树
https://blog.csdn.net/weixin_44517656/article/details/105227705 //哈夫曼树
- 5)小问题思考:
我们可以通过set的迭代器改变元素的值吗?
不行,因为set集合是根据元素值进行排序,关系到set的排序规则,
如果任意改变set的元素值,会严重破坏set组织。
实际上我们常用的map/mmap这些也是红黑树实现的容器,平时都是用于增删查找用的或者叫保存数据使用的,
基本不会进行改操作。虽然也可以通过迭代器或者[]改变值,但是会影响容器的排序规则,sb程序员才会这样做,
所以不建议大家这样做。
若你实在想修改某个set容器内的值,你可以先删除该值再重新插入你要修改的值,这才是安全的做法。
由于set和multiset基本是一样的,唯一的区别是multiset可以存在多个相同的key,而set只能存在唯一的key,所以我们将这两个容器放在一起将。
1 set容器
1.1 set的构造函数
set<T> st;//set默认构造函数:
set(const set &st);//拷贝构造函数
/*实际上还有其它构造函数,这里只是简单列出部分*/
1.2 set赋值操作
set& operator=(const set &st);//重载等号操作符
swap(st);//交换两个集合容器
1.3 set大小操作
size();//返回容器中元素的数目
empty();//判断容器是否为空
1.4 set插入和删除操作
由于时间不足,并且这个容器我目前不怎么用,所以不作迭代器失效的测试,有空再处理。
/*注意set/multiset是不存在push_xxx和pop_xxx类型的函数的*/
insert(elem);//在容器中插入元素。
clear();//清除所有元素
erase(pos);//删除pos迭代器所指的元素,返回下一个元素的迭代器。
erase(beg, end);//删除区间[beg,end)的所有元素 ,返回下一个元素的迭代器。
erase(elem);//删除容器中值为elem的元素。
1.5 set查找操作
find(key);//查找键key是否存在,若存在,返回该键的元素的迭代器;若不存在,返回set.end();
count(key);//查找键key的元素个数.对于set而言 结果要么是0,要么是1.
lower_bound(keyElem);//返回第一个key>=keyElem元素的迭代器。
upper_bound(keyElem);//返回第一个key>keyElem元素的迭代器。
equal_range(keyElem);//返回容器中key与keyElem相等时,相邻左右两边的两个迭代器。
void test02(){
set<int>s;
s.insert(10);
s.insert(30);
s.insert(20);
s.insert(50);
s.insert(40);
set<int>::iterator pos = s.find(30);
if (pos != s.end()){
cout << "找到了元素:" << *pos << endl;
}
else{
cout << "未找到" << endl;
}
//统计 对于set而言 结果要么是0 要么是1
int num = s.count(10);
cout << "10的个数为: " << num << endl;
//lower_bound(keyElem);//返回第一个key>=keyElem元素的迭代器。
set<int>::iterator res = s.lower_bound(30);
if (res != s.end()){
cout << "找到lower_bound的值为: " << *res << endl;
}
else{
cout << "未找到" << endl;
}
//upper_bound(keyElem);//返回第一个key>keyElem元素的迭代器。
res = s.upper_bound(30);
if (res != s.end()){
cout << "找到upper_bound的值为: " << *res << endl;
}
else{
cout << "未找到" << endl;
}
//equal_range(keyElem);//返回容器中key与keyElem相等时的左右两边的两个迭代器。
pair<set<int>::iterator, set<int>::iterator> it = s.equal_range(30);
if (it.first != s.end()){
cout << "找到equal_range中相等值的左值为:" << *(it.first) << endl;
}
else{
cout << "未找到" << endl;
}
if (it.second != s.end()){
cout << "找到equal_range中相等值的右值为:" << *(it.second) << endl;
}
else{
cout << "未找到" << endl;
}
}
结果:
1.6 set的插入操作
由于红黑树的原因,set的插入只有insert这个方法,所以不难。类似map。下面例子想说明的是set和multiset的区别,multiset可以插入相同的key。
void test03(){
set<int>s;
//insert返回值是对组,参1为容器元素类型的迭代器,参2是bool(map也一样)
pair<set<int>::iterator, bool> ret = s.insert(10);
if (ret.second){
cout << "第一个插入成功" << endl;
}
else{
cout << "第一个插入未成功" << endl;
}
ret = s.insert(10);
if (ret.second){
cout << "第二个插入成功" << endl;
}
else{
cout << "第二个插入未成功" << endl;
}
//printSet(s);
/*multiset可以存在相同的key*/
multiset <int>ms;
ms.insert(10);
ms.insert(10);
for (multiset<int>::iterator it = ms.begin(); it != ms.end(); it++){
cout << *it << endl;
}
}
结果:
1.7 set的排序(最重要的一点)
由于底层是红黑树,与map一样,如果你传入的模板类型是自定义类型,则必须要提供排序的函数,因为红黑树是默认自动排序的。注意这里因为是模板,只能传函数对象才行,map也是,不能传lambda表达式这些,区分一下模板(不能是lambda表达式这些)与回调函数(可以是lambda表达式这些)。
void test04(){
set<Person, MyComparePerson> s;
//set < Person, [&](const Person & p1, const Person & p2) {return p1.m_Age < p2.m_Age; }) s;//error
Person p1("aaa", 10);
Person p2("bbb", 30);
Person p3("ccc", 20);
Person p4("ddd", 50);
Person p5("eee", 40);
s.insert(p1);
s.insert(p2);
s.insert(p3);
s.insert(p4);
s.insert(p5);
//对于自定义数据类型,必须指定排序规则
for (set<Person, MyComparePerson>::iterator it = s.begin(); it != s.end(); it++){
cout << "姓名: " << (*it).m_Name.c_str() << " 年龄: " << it->m_Age << endl;
}
}
结果:
2 multiset容器
由于multiset和set差不多,所以这里不再多讲。