1基本介绍
C++ STL 之所以得到广泛的赞誉,也被很多人使用,不只是提供了像vector, string, list等方便的容器,更重要的是STL封装了许多复杂的数据结构算法和大量常用数据结构操作。vector封装数组,list封装了链表,map和set封装了二叉树等,在封装这些数据结构的时候,STL按照程序员的使用习惯,以成员函数方式提供的常用操作,如:插入、排序、删除、查找等。让用户在STL使用过程中,并不会感到陌生。
关于set,必须说明的是set关联式容器。set作为一个容器也是用来存储同一数据类型的数据类型,并且能从一个数据集合中取出数据,在set中每个元素的值都唯一,而且系统能根据元素的值自动进行排序。应该注意的是set中数元素的值不能直接被改变。C++ STL中标准关联容器set, multiset, map,multimap内部采用的就是一种非常高效的平衡检索二叉树:红黑树,也成为RB树(Red-Black Tree)。RB树的统计性能要好于一般平衡二叉树,所以被STL选择作为了关联容器的内部结构。
来自 <http://www.cnblogs.com/BeyondAnyTime/archive/2012/08/13/2636375.html>
2基本特性
1.自动排序。
这个单词的中文意思是集合的意思,数学中的集合有互异性,无序性,确定性三个特性。而STL在中的set略有不同。这里的set确实有互异性,和确定性两个特点,但是他还提供了非常高效的排序功能,而且他的排序比较特殊。实际情况中,常用于对string排序。他对string的排序,是按照“大写字母在前,小写字母在后,大小内部按字母表顺序排序”的规则来排序的。
请看一下实例:
#include<iostream>
#include<set>
#include<string>
using namespace std;
int main()
{
set<string>dict;
dict.insert("Abc");
dict.insert("abc");
dict.insert("Bac");
dict.insert("bac");
for(set<string>::iteratorit=dict.begin();it!=dict.end();it++)
{
cout<<*it<<endl;
}
return0;
}
输出结果:
更多的样例:
安迪的第一个字典。
https://www.bbsmax.com/A/mo5keGP2zw/
反片语。(具体题目请百度,这里为了节省篇幅做了缩减)
输入一些单词,找出所有满足如下条件的单词:该单词不能通过字母重排,得到输入文
本中的另外一个单词。在判断是否满足条件时,字母不分大小写,但在输出时应保留输入中
的大小写,按字典序进行排列(所有大写字母在所有小写字母的前面)。
样例输入:
laddercame tape soon leader acme RIDE lone Dreis peat
ScAlEorb eye Rides dealer NotE derail LaCeS drIed
noeldire Disk mace Rob dries
# 样
例输出:
Disk
NotE
derail
drIed
eye
ladder
soon
思路,将单词“标准化”(大写换小写,单词见字母排序),建立两个集合,一个放标准化的,一个放输出的(放肆利用他的排序:》)。
#include<set>
#include<iostream>
#include<string>
#include<algorithm>
using namespace std;
string to_std(stringtemp)
{
for(inti=0;i<temp.length();i++)
temp[i]=tolower(temp[i]);
sort(temp.begin(),temp.end());
}
int main()
{
set<string>dict;
set<string>dst;
string temp,t;
while(cin>>temp)
{
if(temp[0]=='#')
break;
t=to_std(temp);
if(dict.find(dict.begin(),dict.end(),t)==dict.end())
{
dict.insert(t);
dst.insert(temp);
}
}
for(set<string>::iteratorit=dst.begin();it!=dst.end();it++)
cout<<*it<<endl;
}
关于set有下面几个问题: (2)为何map和set的插入删除效率比用其他序列容器高? 大部分人说,很简单,因为对于关联容器来说,不需要做内存拷贝和内存移动。说对了,确实如此。set容器内所有元素都是以节点的方式来存储,其节点结构和链表差不多,指向父节点和子节点。结构图可能如下:
A / \ B C / \ / \ D E F G 因此插入的时候只需要稍做变换,把节点的指针指向新的节点就可以了。删除的时候类似,稍做变换后把指向删除节点的指针指向其他节点也OK了。这里的一切操作就是指针换来换去,和内存移动没有关系。 (3)为何每次insert之后,以前保存的iterator不会失效? iterator这里就相当于指向节点的指针,内存没有变,指向内存的指针怎么会失效呢(当然被删除的那个元素本身已经失效了)。相对于vector来说,每一次删除和插入,指针都有可能失效,调用push_back在尾部插入也是如此。因为为了保证内部数据的连续存放,iterator指向的那块内存在删除和插入过程中可能已经被其他内存覆盖或者内存已经被释放了。即使时push_back的时候,容器内部空间可能不够,需要一块新的更大的内存,只有把以前的内存释放,申请新的更大的内存,复制已有的数据元素到新的内存,最后把需要插入的元素放到最后,那么以前的内存指针自然就不可用了。特别时在和find等算法在一起使用的时候,牢记这个原则:不要使用过期的iterator。 (4)当数据元素增多时,set的插入和搜索速度变化如何? 如果你知道log2的关系你应该就彻底了解这个答案。在set中查找是使用二分查找,也就是说,如果有16个元素,最多需要比较4次就能找到结果,有32个元素,最多比较5次。那么有10000个呢?最多比较的次数为log10000,最多为14次,如果是20000个元素呢?最多不过15次。看见了吧,当数据量增大一倍的时候,搜索次数只不过多了1次,多了1/14的搜索时间而已。你明白这个道理后,就可以安心往里面放入元素了。
来自 <http://www.cnblogs.com/BeyondAnyTime/archive/2012/08/13/2636375.html>
|
|
3成员函数
begin() ,返回set容器的第一个元素
end() ,返回set容器的最后一个元素
clear() ,删除set容器中的所有的元素
empty() ,判断set容器是否为空
max_size() ,返回set容器可能包含的元素最大个数
size() ,返回当前set容器中的元素个数
rbegin ,返回的值和end()相同
rend() ,返回的值和rbegin()相同
count() 用来查找set中某个某个键值出现的次数。这个函数在set并不是很实用,因为一个键值在set只可能出现0或1次,这样就变成了判断某一键值是否在set出现过了。
equal_range() ,返回一对定位器,分别表示第一个大于或等于给定关键值的元素和 第一个大于给定关键值的元素,这个返回值是一个pair类型,如果这一对定位器中哪个返回失败,就会等于end()的值。具体这个有什么用途我还没遇到过~~~
erase(iterator) ,删除定位器iterator指向的值
erase(first,second),删除定位器first和second之间的值
erase(key_value),删除键值key_value的值
find() ,返回给定值值得定位器,如果没找到则返回end()。
具体的样例程序可参考下面这篇博客。
insert(key_value); 将key_value插入到set中 ,返回值是pair<set<int>::iterator,bool>,bool标志着插入是否成功,而iterator代表插入的位置,若key_value已经在set中,则iterator表示的key_value在set中的位置。
inset(first,second);将定位器first到second之间的元素插入到set中,返回值是void.
lower_bound(key_value) ,返回第一个大于等于key_value的定位器
upper_bound(key_value),返回最后一个大于等于key_value的定位器
来自 <http://www.cnblogs.com/BeyondAnyTime/archive/2012/08/13/2636375.html>
学习中的一点总结,欢迎拍砖哦^^
>
>
>