C++STL中的unique函数解析

转载文章!!

一.总述

unique函数属于STL中比较常用函数,它的功能是元素去重。即”删除”序列中所有相邻的重复元素(只保留一个)。此处的删除,并不是真的删除,而是指重复元素的位置被不重复的元素给占领了(详细情况,下面会讲)。由于它”删除”的是相邻的重复元素,所以在使用unique函数之前,一般都会将目标序列进行排序。

二.函数原型

unique函数的函数原型如下:

1.只有两个参数,且参数类型都是迭代器:

1
iterator unique(iterator it_1,iterator it_2);

这种类型的unique函数是我们最常用的形式。其中这两个参数表示对容器中[it_1,it_2)范围的元素进行去重(注:区间是前闭后开,即不包含it_2所指的元素),返回值是一个迭代器,它指向的是去重后容器中不重复序列的最后一个元素的下一个元素。

2.有三个参数,且前两个参数类型为迭代器,最后一个参数类型可以看作是bool类型:

1
iterator unique(iterator it_1,iterator it_2,bool MyFunc);
该类型的unique函数我们使用的比较少,其中前两个参数和返回值同上面类型的unique函数是一样的,主要区别在于第三个参数。这里的第三个参数表示的是自定义元素是否相等。也就是说通过自定义两个元素相等的规则,来对容器中元素进行去重。这里的第三个参数与STL中sort函数的第三个参数功能类似(关于sort函数:http://www.cnblogs.com/wangkundentisy/p/8982180.html)。关于第三个参数的详细介绍,可以参考:http://www.cplusplus.com/reference/algorithm/unique/

三.函数用法实例

上面介绍了unique函数的功能和原型,那么,它到底是如何进行去重的呢?即“删除”的具体操作是怎样的呢?

关于这个问题,http://www.cplusplus.com/reference/algorithm/unique/给了我们一种解释,即unique函数是完全等价于下面这个函数的:

1
2
3
4
5
6
7
8
9
10
11
12
iterator My_Unique (iterator first, iterator last)
{
if (first==last) return last;

iterator result = first;
while (++first != last)
{
if (!(*result == *first))
*(++result)=*first;
}
return ++result;
}
分析这段代码,我们可以知道,unique函数的去重过程实际上就是不停的把后面不重复的元素移到前面来,也可以说是用不重复的元素占领重复元素的位置。有了这段代码我们可以结合实例来更好的理解这个函数了。

实例:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
#include
#include
#include
using namespace std;

static bool myfunc(int i, int j)
{
return (i + 1) == j;
//return i == j;
}
int main()
{

vector<int> a = {1,3,3,4,5,6,6,7};
vector<int>::iterator it_1 = a.begin();
vector<int>::iterator it_2 = a.end();

//sort(it_1,it_2);
cout<<"去重前的 a : ";
for(int i = 0 ; i < a.size(); i++)
    cout<<a[i];
cout<<endl;
//it_h = unique(it_1,it_2);
//unique(it_1,it_2,myfunc);
unique(it_1,it_2);
cout<<"去重后的 a : ";
for(int i = 0 ; i < a.size(); i++)
    cout<<a[i];
cout<<endl;

}

运行结果如下:

对于上面的结果,我们可以看到,容器中不重复的元素都移到了前面,至于后面的元素,实际上并没有改变(这个过程只需结合My_Unique函数来分析即可)。

注:

1.有很多文章说的是,unique去重的过程是将重复的元素移到容器的后面去,实际上这种说法并不正确,应该是把不重复的元素移到前面来。

2.一定不要忘记的是,unique函数在使用前需要对容器中的元素进行排序(当然不是必须的,但我们绝大数情况下需要这么做),由于本例中的元素已经是排好序的,所以此处我没排序,但实际使用中不要忘记。

四.用法拓展

1.我们以上的实例针对的是函数原型1的用法,对于函数原型2,我们仍然使用上述实例,只不过unique的用法变成:

1
unique(it_1,it_2,myfunc);
即自定义的元素相等的准则,其中myfunc在上述实例中有其源码,分析可知,只有i+1 == j的时候我们才认为i和j“相等”;实例结果如下:

也就是说,按照我们自定义的规则,这个实例中只有3和4”相等的”,4和5是”相等的”,5和6,6和7是”相等的”。所以最终结果是上图的样子。

2.unique函数通常和erase函数一起使用,来达到删除重复元素的目的。(注:此处的删除是真正的删除,即从容器中去除重复的元素,容器的长度也发生了变换;而单纯的使用unique函数的话,容器的长度并没有发生变化,只是元素的位置发生了变化)关于erase函数的用法,可以参考:http://www.cnblogs.com/wangkundentisy/p/9023977.html。下面是一个具体的实例:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
#include
#include
#include
using namespace std;

int main()
{

vector<int> a ={1,3,3,4,5,6,6,7};
vector<int>::iterator it_1 = a.begin();
vector<int>::iterator it_2 = a.end();
vector<int>::iterator new_end;

new_end = unique(it_1,it_2); //注意unique的返回值
a.erase(new_end,it_2);
cout<<"删除重复元素后的 a : ";
for(int i = 0 ; i < a.size(); i++)
    cout<<a[i];
cout<<endl;

}
运行结果如下:
在这里插入图片描述

可以看到,相比之前的结果,a的长度确实发生了改变,真正的删除了a中的重复元素。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
C++ STL 的 sort 和 unique 函数都是算法函数,用于对指定范围内的元素进行排序和去重。 sort 函数用于对指定范围内的元素进行升序排列,默认使用 operator< 进行比较。sort 函数的定义如下: ```c++ template<class RandomAccessIterator> void sort(RandomAccessIterator first, RandomAccessIterator last); template<class RandomAccessIterator, class Compare> void sort(RandomAccessIterator first, RandomAccessIterator last, Compare comp); ``` 其,first 和 last 分别表示要排序的元素范围的起始和终止位置,包括起始位置但不包括终止位置。如果要排序的元素是一个数组,可以使用数组名和数组名加上元素个数来表示起始和终止位置。 sort 函数的第二个参数 comp 是一个可选的比较函数,用于自定义元素之间的大小关系。如果不指定比较函数,则默认使用 operator<。比较函数需要满足严格弱序关系,即满足: 1. 自反性:对于所有的 x,都有 x <= x。 2. 反对称性:对于所有的 x 和 y,如果 x < y,则 y > x。 3. 传递性:对于所有的 x、y 和 z,如果 x < y 且 y < z,则 x < z。 4. 可比较性:元素之间必须可以进行比较。 unique 函数用于去重,可以将指定范围内相邻的重复元素保留一个,并返回去重后的数组末尾的迭代器。unique 函数的定义如下: ```c++ template<class ForwardIterator> ForwardIterator unique(ForwardIterator first, ForwardIterator last); template<class ForwardIterator, class BinaryPredicate> ForwardIterator unique(ForwardIterator first, ForwardIterator last, BinaryPredicate pred); ``` 其,first 和 last 分别表示要去重的元素范围的起始和终止位置,包括起始位置但不包括终止位置。unique 函数的第二个参数 pred 是一个可选的二元谓词函数,用于自定义元素之间的相等关系。如果不指定二元谓词函数,则默认使用 operator==。二元谓词函数需要满足等价关系,即满足: 1. 自反性:对于所有的 x,都有 pred(x, x) = true。 2. 对称性:对于所有的 x 和 y,有 pred(x, y) = pred(y, x)。 3. 传递性:对于所有的 x、y 和 z,如果 pred(x, y) 且 pred(y, z),则 pred(x, z)。 需要注意的是,unique 函数并不会改变数组的大小,只是将重复元素移到了数组的末尾,并返回去重后的数组末尾的迭代器。因此,去重后的元素个数可以通过数组的起始地址和返回值的差来计算。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值