C++之STL中set的用法总结
set概述
和vector、list不同,set、map都是关联式容器。set内部是基于红黑树实现的。插入和删除操作效率较高,因为只需要修改相关指针而不用进行数据的移动。
在进行数据删除操作后,迭代器会不会失效呢?删除set的数据时,实际的操作是删除红黑树中的一个节点,然后相关指针做相关调整。指向其他元素的迭代器还是指向原位置,并没有改变,所以删除一个节点后其他迭代器不会失效。list和map也是同样的道理。然而删除vector中的某个元素,vector中其他迭代器会失效,因为vector是基于数组的,删除一个元素后,后面的元素会往前移动,所以指向后面元素的迭代器会失效。
再稍微说一下迭代器的实现。迭代器是一个对象,vector的迭代器是封装了数组下标;list、map、set的迭代器是封装了元素节点的指针。
还有一点,从数学层面,set的一个集合,好比一个袋子里面装了好多个小球。但是红黑树是一种特殊的二叉搜索树,set中的元素根据其值的大小在红黑树中有特定的位置,是不可移动的。所以,1是search操作效率会很高O(log n),2是set中元素的值不可改变。
set的数据操作
::begin() //迭代器,指向set容器的第一个元素
::end() //迭代器,指向set容器的最后一个元素的下一个位置
::clear() //删除set容器中的所有的元素
::erase() //删除元素
::empty() //判断set容器是否为空
::max_size() //返回set容器可能包含的元素最大个数
::size() //返回当前set容器中的元素个数
::rbegin //逆迭代器
::rend() //逆迭代器
::insert() //插入元素
::find() //如果找到返回其位置,找不到返回end()
::count() //查找某个元素出现的次数(只能是0/1)
equal_range() //返回一对定位器,分别表示第一个大于或等于给定关键值的元素和 第一个大于给定关键值的元素,
这个返回值是一个pair类型,如果这一对定位器中哪个返回失败,就会等于end()的值
erase(iterator) //删除定位器iterator指向的值
erase(first,second) //删除定位器first和second之间的值
erase(key_value) //删除键值key_value的值
inset(first,second) //将定位器first到second之间的元素插入到set中,返回值是void.
其中插入和find的时间复杂多是O(logn)
lower_bound(val): 返回容器中第一个值【大于或等于】val的元素的iterator位置。
upper_bound(val): 返回容器中第一个值【大于】val的元素的iterator位置。
小问题
set是基于红黑树实现的,那么set的迭代器begin()、end()是指向哪里的呢? 一个测试程序:
#include<iostream>
#include<set>
using namespace std;
int main(){
set<int> myset;
myset.insert(4);
myset.insert(7);
myset.insert(2);
myset.insert(0);
myset.insert(4);
set<int>::iterator it;
for(it = myset.begin(); it != myset.end(); it++){
cout<< *it; //输出结果是:0247,*it表示访问it表示的实体
}
}
红黑树首先是二叉搜索树,所以begin()迭代器指向红黑树的最左边的节点,end()迭代器指向红黑树的最右边的节点。另外这个小程序还说明了重复插入无效
L2-005. 集合相似度
给定两个整数集合,它们的相似度定义为:Nc/Nt*100%。其中Nc是两个集合都有的不相等整数的个数,Nt是两个集合一共有的不相等整数的个数。你的任务就是计算任意一对给定集合的相似度。
输入格式:
输入第一行给出一个正整数N(<=50),是集合的个数。随后N行,每行对应一个集合。每个集合首先给出一个正整数M(<=104),是集合中元素的个数;然后跟M个[0, 109]区间内的整数。
之后一行给出一个正整数K(<=2000),随后K行,每行对应一对需要计算相似度的集合的编号(集合从1到N编号)。数字间以空格分隔。
输出格式:
对每一对需要计算的集合,在一行中输出它们的相似度,为保留小数点后2位的百分比数字。
输入样例:3 3 99 87 101 4 87 101 5 87 7 99 101 18 5 135 18 99 2 1 2 1 3输出样例:
50.00% 33.33%
提 交代码
用set容器插入时,重复插入无效,此题重复的数据无用,set查找时方便
code:
#include<stdio.h>
#include<math.h>
#include<set>
#include<algorithm>
using namespace std;
typedef long long LL;
int n,m,k,a;
set<int>s[55];
double solve(int x,int y)
{
int nc=0,nt=0;
set<int>::iterator it;
for(it=s[x].begin();it!=s[x].end();it++)
{
if(s[y].find(*it)!=s[y].end())
nc++;
}
nt=s[x].size()+s[y].size()-nc;
return nc*1.0/nt*1.0;
}
int main()
{
scanf("%d",&n);
for(int i=1;i<=n;i++)
{
scanf("%d",&m);
while(m--)
{
scanf("%d",&a);
s[i].insert(a);
}
}
scanf("%d",&k);
int x,y;
while(k--)
{
scanf("%d%d",&x,&y);
double ans=solve(x,y)*100.0;
printf("%.2lf%%\n",ans);
}
}