VC.STL Newsgroup Good Questions(一)<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />
使用Sort Function时程序挂起,Why?
Article last modified on 2002-5-29
----------------------------------------------------------------
The information in this article applies to:
- Microsoft Visual C++, 32-bit Editions, version 6.0, SP5
----------------------------------------------------------------
Question:
下面的代码总是运行时挂起。 谁知道为什么?但是如果我将not2去掉或者将VECTOR_SIZE减至16,就能正常工作了。代码如下:
|
Answer:
有一位名为"Marco Dalla Gasperina"的朋友这么评论道: “这应该是你的程序的一个Bug。 原因是,sort()希望是一个Strict Weak Ordering。但在你的代码中,not2(greater())的意思就是“not greater”,相当于“less than or equal to”。这不是一个Strict Weak Ordering。当两个元素相等时,这个表达式就会发生一些未知行为。 有两个方案: 方案1:改为sort(vecStrings.begin(), vecStrings.end(), not2(greater_equal<int>()));</int>即可! 方案2:直接写sort(vecStrings.begin(), vecStrings.end())即可,因为less<int>()</int>是默认的sort行为。”
但是我总觉得不对。 我的思路是这样的: 首先我可以证明not2(greater())是没有问题的。在MSDN(2002 January)中的less_equal Function(ms-help://MS.MSDNQTR.2002JAN.1033/vcstdlib/html/vclrf_functional_Lessequal.htm)中讲道: The binary predicate less_equal<type> provides a strict weak ordering</type> of a set of element values of type Type into equivalence classes if and only if this Type satisfies the standard mathematical requirements for being so ordered. 而且它下面给的例子就是这么直接用的: 我试过这个例子,完全可以运行。 这就说明“less than or equal to”这种操作用于sort function完全没有问题,这本来就是Strict Weak Ordering。
其次,我可以证明这种hang现象是和特定的vector元素有关系的。 仍然采用less_equal的例子做实验,毕竟它比较可信。它原来插入vector的元素是: } 也就是说,元素为:( 41 18467 6334 26500 19169 2836 2836 2836 ) 修改1:现在我们改为: for ( i = 0 ; i { v1.push_back( 5 ); } 这样执行到sort()时就挂起了。其实是进入到了一个死循环。 修改2:改为16个元素呢: for ( i = 0 ; i { v1.push_back( 5 ); } 就可以了。 可以说,肯定是STL的本身问题。
那么跟什么有关呢?经过试验,我们发现好像跟vector的元素数目有关系,vector的元素数不能大于16! 比如: int nSize = 8; for ( i = 0 ; i { v1.push_back( rand( ) ); v1.push_back( 5 ); } 中nSize只能增长到8为止。
而 int nSize = 15; for ( i = 0 ; i { v1.push_back( rand( ) ); } for ( i = 0 ; i v1.push_back( 5 ); 中的nSize只能增长到15为止。
跟踪的结果是: STL的头文件algorithm的第599行为: template<class _ri class _ty _pr> inline<br>void _Sort(_RI _F, _RI _L, _Pr _P, _Ty *)<br>{<br><b><span style="COLOR: red">for (; _SORT_MAX </span></b><br> {<br> _RI _M = _Unguarded_partition(_F, _L, _Median(_Ty(*_F),<br> _Ty(*(_F + (_L - _F) / 2)), _Ty(*(_L - 1)), _P), _P);<br> if (_L - _M _Sort(_M, _L, _P, _Val_type(_F)), _L = _M;<br> else<br> _Sort(_F, _M, _P, _Val_type(_F)), _F = _M;<br> }<br> }</class> 这就是sort function执行的细节部分。其中的_SORT_MAX定义为16,这是在第16行定义的。 Sort function如何执行,将会进行如下的判断: template<class _ri class _ty _pr> inline<p></p></class> void _Sort_0(_RI _F, _RI _L, _Pr _P, _Ty *) {if (_L - _F _Insertion_sort(_F, _L, _P); else {_Sort(_F, _L, _P, (_Ty *)0); _Insertion_sort(_F, _F + _SORT_MAX, _P); for (_F += _SORT_MAX; _F != _L; ++_F) _Unguarded_insert(_F, _Ty(*_F), _P); }} 对于重复的元素没有达到一定程度时,_L-_F就会小于或等于16,这样就会调用_Insertion_sort。而这个_Insertion_sort里面只是用到了If—Else语句。 当重复的元素的数目达到一定程度后,使得_L-_F大于16,就会调用_Sort(_F, _L, _P, (_Ty *)0)。这里面可是一个for循环!而且for循环退出的条件为: for (; _SORT_MAX 对于实际情况,就会为: 16 5 - 5 多么可怕的事情!这个条件永远也满足不了的!这样就陷入了死循环!所以这应不应该算作STL的Bug!?
|
(To be Continued)
Written by zhengyun@tomosoft.com
Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=12673