由 www.169it.com 搜集整理
在C++的STL库中,要实现排序可以通过将所有元素保存到vector中,然后通过sort算法来排序,也可以通过multimap实现在插入元素的时候进行排序。在通过vector+sort进行排序时,所有元素需要先存入vector容器中,sort在排序时又需要将元素全部取出来再进行排序。multimap底层实现为红黑树,因此元素在插入的过程中就实现了排序。那么到底哪一种排序速度更快呢?
下面有一个测试程序:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 | #include <vector> #include <set> #include <algorithm> #include <stdio.h> #include <string.h> #include <unistd.h> #include <sys/types.h> #include <sys/time.h> using namespace std; double time() { struct timeval tv; if (gettimeofday(&tv, NULL) != 0) return 0.0; return tv.tv_sec + tv.tv_usec / 1000000.0; } struct Score { string name; double score; bool operator <(const Score& right) const { return score < right.score; } }; int main(int argc, char** argv) { vector<Score> src; for (int i = 0; i < 10000000; i++) { int num = rand(); char buf[32]; sprintf(buf, "%d", num); Score score = { buf, num }; src.push_back(score); } { double stime = time(); vector<Score> res; for (vector<Score>::const_iterator it = src.begin(); it != src.end(); ++it) { res.push_back(*it); } sort(res.begin(), res.end()); double etime = time(); printf("vector: %f\n", etime - stime); } { double stime = time(); multiset<Score> res; for (vector<Score>::const_iterator it = src.begin(); it != src.end(); ++it) { res.insert(*it); } double etime = time(); printf("multiset: %f\n", etime - stime); } return 0; } |
程序运行结果为:
1 2 3 | time vector 4.776060 multiset 10.761023 |
在这个测试中,vector+sort排序比multiset(multimap实现基于multiset)快多了。快速排序是目前已知的所有排序算法中最快的排序算法,因此它比基于堆排序的multiset快。
在这个测试结果出来之前,大多数人都会毫无疑问地认为multiset排序要更快。这也是有原因的,快速排序速度虽然快,但是在实际的运行过程中,它需要大量地拷贝元素,其拷贝操作的时间复杂度为o(NlogN),而基于红黑树的multiset在排序的过程中则避免了元素的拷贝。如果元素的内存占用空间比较大,那么multiset排序的速度将比vector+sort快。为了测试这个结果,将上面测试程序中的结构体改为:
1 2 3 4 5 6 7 8 9 10 | struct Score { string name1; string name2; string name3; string name4; double score; bool operator <(const Score& right) const { return score < right.score; } }; |
然后重新编译运行测试程序,测试结果为:
1 2 3 | time vector 12.955739 multiset 11.368364 |
这个测试结果和我们的预期一致。
总之,我们在使用STL的排序算法时,需要根据不同的元素构造来进行合适的选择,如果都是比较简单的元素,那么适合选择vector+sort来进行排序,对于由字符串构成的占用了比较大的空间的复杂元素,应该使用multiset。如果排序的元素的总个数比较少,那么选择任意一种都可以。