介绍
这篇文章的目的是为了介绍 std::vector ,如何恰当地使用它们的成员函数等操作。本文中还讨论了条件函数和函数指针在迭代算法中使用,如在 remove_if() 和 for_each() 中的使用。通过阅读这篇文章读者应该能够有效地使用 vector 容器,而且应该不会再去使用 C 类型的动态数组了。
Vector 总览
vector 是 C++ 标准模板库中的部分内容,它是一个多功能的,能够操作多种数据结构和算法的模板类和函数库。 vector 之所以被认为是一个容器,是因为它能够像容器一样存放各种类型的对象,简单地说, vector 是一个能够存放任意类型的动态数组,能够增加和压缩数据。
为了可以使用 vector ,必须在你的头文件中包含下面的代码:
# include <vector> |
vector 属于 std 命名域的,因此需要通过命名限定,如下完成你的代码:
using std::vector; vector< int > vInts; |
或者连在一起,使用全名:
std::vector< int > vInts; |
建议使用全局的命名域方式:
using namespace std; |
在后面的操作中全局的命名域方式会造成一些问题。 vector 容器提供了很多接口,在下面的表中列出 vector 的成员函数和操作。
Vector 成员函数
函数 | 表述 |
c.assign(beg,end) c.assign(n,elem) | 将 [beg; end) 区间中的数据赋值给 c 。 将 n 个 elem 的拷贝赋值给 c 。 |
c.at(idx) | 传回索引 idx 所指的数据,如果 idx 越界,抛出 out_of_range 。 |
c.back() | 传回最后一个数据,不检查这个数据是否存在。 |
c.begin() | 传回迭代器重的可一个数据。 |
c.capacity() | 返回容器中数据个数。 |
c.clear() | 移除容器中所有数据。 |
c.empty() | 判断容器是否为空。 |
c.end() | 指向迭代器中的最后一个数据地址。 |
c.erase(pos) c.erase(beg,end) | 删除 pos 位置的数据,传回下一个数据的位置。 删除 [beg,end) 区间的数据,传回下一个数据的位置 。 |
c.front() | 传回第一个数据。 |
get_allocator | 使用构造函数返回一个拷贝。 |
c.insert(pos,elem) c.insert(pos,n,elem) c.insert(pos,beg,end) | 在 pos 位置插入一个 elem 拷贝,传回新数据位置。 在 pos 位置插入 n 个 elem 数据。无返回值。 在 pos 位置插入在 [beg,end) 区间的数据。无返回值。 |
c.max_size() | 返回容器中最大数据的数量。 |
c.pop_back() | 删除最后一个数据。 |
c.push_back(elem) | 在尾部加入一个数据。 |
c.rbegin() | 传回一个逆向队列的第一个数据。 |
c.rend() | 传回一个逆向队列的最后一个数据的下一个位置。 |
c.resize(num) | 重新指定队列的长度。 |
c.reserve() | 保留适当的容量。 |
c.size() | 返回容器中实际数据的个数。 |
c1.swap(c2) swap(c1,c2) | 将 c1 和 c2 元素互换。 同上操作。 |
vector<Elem> c vector <Elem> c1(c2) vector <Elem> c(n) vector <Elem> c(n, elem) vector <Elem> c(beg,end) c.~ vector <Elem>() | 创建一个空的 vector 。 复制一个 vector 。 创建一个 vector ,含有 n 个数据,数据均已缺省构造产生 。 创建一个含有 n 个 elem 拷贝的 vector 。 创建一个以 [beg;end) 区间的 vector 。 销毁所有数据,释放内存。 |
Vector 操作
函数 | 描述 |
operator [] | 返回容器中指定位置的一个引用。 |
创建一个 vector
vector 容器提供了多种创建方法,下面介绍几种常用的。
创建一个 Widget 类型的空的 vector 对象:
vector<Widget> vWidgets; // ------ // | // |- Since vector is a container, its member functions // operate on iterators and the container itself so // it can hold objects of any type. |
创建一个包含 500 个 Widget 类型数据的 vector :
vector<Widget> vWidgets(500); |
创建一个包含 500 个 Widget 类型数据的 vector ,并且都初始化为 0 :
vector<Widget> vWidgets(500, Widget(0)); |
创建一个 Widget 的拷贝:
vector<Widget> vWidgetsFromAnother(vWidgets); |
向 vector 添加一个数据
vector 添加数据的缺省方法是 push_back() 。 push_back() 函数表示将数据添加到 vector 的尾部,并按需要来分配内存。例如:向 vector<Widget> 中添加 10 个数据,需要如下编写代码:
for (int i= 0;i<10; i++) vWidgets.push_back(Widget(i)); |
获取 vector 中制定位置的数据
很多时候我们不必要知道 vector 里面有多少数据, vector 里面的数据是动态分配的,使用 push_back() 的一系列分配空间常常决定于文件或一些数据源。如果你想知道 vector 存放了多少数据,你可以使用 empty() 。获取 vector 的大小,可以使用 size() 。例如,如果你想获取一个 vector v 的大小,但不知道它是否为空,或者已经包含了数据,如果为空想设置为 -1 ,你可以使用下面的代码实现:
int nSize = v.empty() ? -1 : static_cast < int >(v.size()); |
访问 vector 中的数据
使用两种方法来访问 vector 。
1、 vector::at()
2、 vector::operator[]
operator[] 主要是为了与 C 语言进行兼容。它可以像 C 语言数组一样操作。但 at() 是我们的首选,因为 at() 进行了边界检查,如果访问超过了 vector 的范围,将抛出一个例外。由于 operator[] 容易造成一些错误,所有我们很少用它,下面进行验证一下:
分析下面的代码:
vector< int > v; v.reserve(10);
for ( int i=0; i<7; i++) v.push_back(i);
try { int iVal1 = v[7]; // not bounds checked - will not throw int iVal2 = v.at(7); // bounds checked - will throw if out of range } catch ( const exception& e) { cout << e.what(); } |
我们使用 reserve() 分配了 10 个 int 型的空间,但并不没有初始化。
你可以在这个代码中尝试不同条件,观察它的结果,但是无论何时使用 at() ,都是正确的。
删除 vector 中的数据
vector 能够非常容易地添加数据,也能很方便地取出数据,同样 vector 提供了 erase() , pop_back() , clear() 来删除数据,当你删除数据的时候,你应该知道要删除尾部的数据,或者是删除所有数据,还是个别的数据。在考虑删除等操作之前让我们静下来考虑一下在 STL 中的一些应用。
Remove_if() 算法
现在我们考虑操作里面的数据。如果要使用 remove_if() ,我们需要在头文件中包含如下代码::
# include <algorithm> |
Remove_if() 有三个参数:
1、 iterator _First :指向第一个数据的迭代指针。
2、 iterator _Last :指向最后一个数据的迭代指针。
3、 predicate _Pred :一个可以对迭代操作的条件函数。
条件函数
条件函数是一个按照用户定义的条件返回是或否的结果,是最基本的函数指针,或者是一个函数对象。这个函数对象需要支持所有的函数调用操作,重载 operator()() 操作。 remove_if() 是通过 unary_function 继承下来的,允许传递数据作为条件。
例如,假如你想从一个 vector<CString> 中删除匹配的数据,如果字串中包含了一个值,从这个值开始,从这个值结束。首先你应该建立一个数据结构来包含这些数据,类似代码如下:
# include <functional> enum findmodes { FM_INVALID = 0, FM_IS, FM_STARTSWITH, FM_ENDSWITH, FM_CONTAINS }; typedef struct tagFindStr { UINT iMode; CString szMatchStr; } FindStr; typedef FindStr* LPFINDSTR; |
然后处理条件判断:
class FindMatchingString : public std::unary_function<CString, bool > {
public : FindMatchingString( const LPFINDSTR lpFS) : m_lpFS(lpFS) {}
bool operator()(CString& szStringToCompare) const { bool retVal = false ;
switch (m_lpFS->iMode) { case FM_IS: { retVal = (szStringToCompare == m_lpFDD->szMatchStr); break ; } case FM_STARTSWITH: { retVal = (szStringToCompare.Left(m_lpFDD->szMatchStr.GetLength()) == m_lpFDD->szWindowTitle); break ; } case FM_ENDSWITH: { retVal = (szStringToCompare.Right(m_lpFDD->szMatchStr.GetLength()) == m_lpFDD->szMatchStr); break ; } case FM_CONTAINS: { retVal = (szStringToCompare.Find(m_lpFDD->szMatchStr) != -1); break ; } }
return retVal; }
private : LPFINDSTR m_lpFS; }; |
通过这个操作你可以从 vector 中有效地删除数据:
// remove all strings containing the value of // szRemove from vector<CString> vs.
FindStr fs; fs.iMode = FM_CONTAINS; fs.szMatchStr = szRemove;
vs.erase(std::remove_if(vs.begin(), vs.end(), FindMatchingString(&fs)), vs.end()); |
Remove_if() 能做什么?
你可能会疑惑,对于上面那个例子在调用 remove_if() 的时候还要使用 erase() 呢?这是因为大家并不熟悉 STL 中的算法。 Remove(),remove_if( ) 等所有的移出操作都是建立在一个迭代范围上的,那么不能操作容器中的数据。所以在使用 remove_if() ,实际上操作的时容器里数据的上面的。思考上面的例子:
1、 szRemove = “o”.
2、 vs 见下面图表中的显示。
观察这个结果,我们可以看到 remove_if() 实际上是根据条件对迭代地址进行了修改,在数据的后面存在一些残余的数据,那些需要删除的数据。剩下的数据的位置可能不是原来的数据,但他们是不知道的。
调用 erase() 来删除那些残余的数据。注意上面例子中通过 erase() 删除 remove_if() 的结果和 vs.enc() 范围的数据。
压缩一个臃肿的 vector
很多时候大量的删除数据,或者通过使用 reserve() ,结果 vector 的空间远远大于实际需要的。所有需要压缩 vector 到它实际的大小。 resize() 能够增加 vector 的大小。 Clear() 仅仅能够改变缓存的大小,所有的这些对于 vector 释放内存等九非常重要了。如何来解决这些问题呢,让我们来操作一下。
我们可以通过一个 vector 创建另一个 vector 。让我们看看这将发生什么。假定我们已经有一个 vector v ,它的内存大小为 1000 ,当我们调用 size() 的时候,它的大小仅为 7 。我们浪费了大量的内存。让我们在它的基础上创建一个 vector 。
std::vector<CString> vNew(v); cout << vNew.capacity(); |
vNew.capacity() 返回的是 7 。这说明新创建的只是根据实际大小来分配的空间。现在我们不想释放 v ,因为我们要在其它地方用到它,我们可以使用 swap() 将 v 和 vNew 互相交换一下?
vNew.swap(v); cout << vNew.capacity(); cout << v.capacity(); |
有趣的是: vNew.capacity() 是 1000 , 而 v.capacity() 是 7 。
现在是达到我的目的了,但是并不是很好的解决方法,我们可以像下面这么写:
std::vector<CString>(v).swap(v); |
你可以看到我们做了什么?我们创建了一个临时变量代替那个命名的,然后使用 swap() , 这样我们就去掉了不必要的空间,得到实际大小的 v 。
结论
我希望这个文档可以给那些使用 STL vector 容器的开发者很有价值的参考。我也希望通过阅读这篇文章你可以放心地使用 vector 来代替 C 语言中的数据了。
参考
Plauger, P.J. Standard C++ Library Reference. February, 2003. MSDN.
Schildt, Herbert. C++ from the Ground Up, Second Edition. Berkeley: 1998.
Sutter, Herb. More Exceptional C++. Indianapolis: 2002.
---------------------------------------------------------------------------------------------------------------------------------------------------------
* vector的初始化有几个方法 vector <T> v1; 默认构造函数,此时v1为空,这是最常见的用法 vector <T> v2(v1) 一个副本,用得少。 相当于vector <T> v2=v1; vector <T> v3(n,i) i的类型是T,v3含n个i,本例用的是这种方法。 vector <T> v4(n) 这种方法最好不用。不能动态增加(个人理解,不一定正确) vector的操作 v.empty() v.size() v.push_back(t) (这个最容易错,记住向vector中加入元素时不是用= 赋值) == != 等比较操作符 vector的遍历,这才是本篇文章的重点 一般是两种方法: 用下标 2.用迭代器下面代码中我两种方法都用了。 */#include "stdafx.h " #include "vector " #include "iostream "using namespace std;
int _tmain(int argc, _TCHAR* argv[]){
string s1="33vc.com ";
vector <string > v1(8,s1); //定义一个string的vector,含个"33vc.com"的字符串
for (size_t i=0; i != v1.size(); ++i)
{
//此处加代码
}
for (vector<string >::iterator iter=v1.begin();iter!=v1.end();++iter)
{
//此处加代码
}
return 0;
}
为了文章的完整性,再转载别人的一篇,比我写得好,但手打一遍印象深刻,嘿嘿。
转载自:http://blog.chinaunix.net/u1/51844/showart_463980.html
1.vector 的数据的存入和输出: #include<stdio.h> #include<vector> #include <iostream> using namespace std; void main() { int i = 0; vector<int > v; for ( i = 0; i < 10; i++ ) { v.push_back( i );//把元素一个一个存入到vector中 } /* v.clear()*/ 对存入的数据清空 for ( i = 0; i < v.size(); i++ )//v.size() 表示vector存入元素的个数 { cout << v[ i ] << " "; //把每个元素显示出来 } cont << endl; } 注:你也可以用v.begin()和v.end() 来得到vector开始的和结束的元素地址的指针位置。你也可以这样做: vector<int >::iterator iter; /*iterator 抽象了指针的绝大部分基本特征*/ for ( iter = v.begin(); iter != v.end(); iter++ ) { cout << *iter << endl; } 2. 对于二维vector的定义。 1)定义一个 10个vector元素,并对每个vector符值1-10。 #include<stdio.h> #include<vector> #include <iostream> using namespace std; void main() { int i = 0, j = 0; //定义一个二维的动态数组,有10行,每一行是一个用一个vector存储这一行的数据。 所以每一行的长度是可以变化的。之所以用到vector<int >(0)是对vector初始化,否则不能对vector存入元素。 vector< vector<int > > Array( 10, vector<int >(0) ); for ( j = 0; j < 10; j++ ) { for ( i = 0; i < 9; i++ ) { Array[ j ].push_back( i ); } } for ( j = 0; j < 10; j++ ) { for ( i = 0; i < Array[ j ].size(); i++ ) { cout << Array[ j ][ i ] << " "; } cout<< endl; } } 2) 定义一个行列都是变化的数组。 #include<stdio.h> #include<vector> #include <iostream> using namespace std; void main() { int i = 0, j = 0; vector< vector<int > > Array; vector< int > line; for ( j = 0; j < 10; j++ ) { Array.push_back( line );//要对每一个vector初始化,否则不能存入元素。 for ( i = 0; i < 9; i++ ) { Array[ j ].push_back( i ); } } for ( j = 0; j < 10; j++ ) { for ( i = 0; i < Array[ j ].size(); i++ ) { cout << Array[ j ][ i ] << " "; } cout<< endl; } } 使用 vettor erase 指定元素 #include "iostream " #include "vector " using namespace std; int main() { vector<int > arr; arr.push_back(6); arr.push_back(8); arr.push_back(3); arr.push_back(8); for (vector<int >::iterator it=arr.begin(); it!=arr.end(); ) { if (* it == 8 ) { it = arr.erase(it); } else { ++it; } } cout << "After remove 8:/n "; for (vector<int >::iterator it = arr.begin(); it < arr.end(); ++it) { cout << * it << " "; } cout << endl; } 1.push_back 在数组的最后添加一个数据 2.pop_back 去掉数组的最后一个数据 3.at 得到编号位置的数据 4.begin 得到数组头的指针 5.end 得到数组的最后一个单元+1的指针 6.front 得到数组头的引用 7.back 得到数组的最后一个单元的引用 8.max_size 得到vector最大可以是多大 9.capacity 当前vector分配的大小 10.size 当前使用数据的大小 11.resize 改变当前使用数据的大小,如果它比当前使用的大,者填充默认值 12.reserve 改变当前vecotr所分配空间的大小 13.erase 删除指针指向的数据项 14.clear 清空当前的vector 15.rbegin 将vector反转后的开始指针返回(其实就是原来的end-1) 16.rend 将vector反转构的结束指针返回(其实就是原来的begin-1) 17.empty 判断vector是否为空 18.swap 与另一个vector交换数据