在VC.Net中使用默认设置/clr编译时,一个托管函数会产生两个入口点,一个是托管的,供托管代码调用,另外一个是非托管的,供非托管代码调用。但是函数地址,特别是虚函数指针只能有一个值,所以需要有一个默认的入口。
非托管入口点可能是所有调用的默认入口(在 Visual Studio .NET2003 中,编译器总是会选择非托管入口,但是在Visual Studio 2005中,如果参数或者返回值中包含托管类型,那么编译器会选择托管入口),而另外一个只是使用托管C++中的互操作功能对默认入口的调用。在一个托管函数被另一个托管函数调用的时候,这可能会造成不必要的托管/非托管上下文切换和参数/返回值的复制。如果函数不会被非托管代码使用指针调用,那么可以在声明函数时用VC2005新增的__clrcall修饰符阻止编译器生成两个入口。
现在用简单的冒泡排序算法来比较一下使用__clrcall之后的性能改善程度。
非托管入口点可能是所有调用的默认入口(在 Visual Studio .NET2003 中,编译器总是会选择非托管入口,但是在Visual Studio 2005中,如果参数或者返回值中包含托管类型,那么编译器会选择托管入口),而另外一个只是使用托管C++中的互操作功能对默认入口的调用。在一个托管函数被另一个托管函数调用的时候,这可能会造成不必要的托管/非托管上下文切换和参数/返回值的复制。如果函数不会被非托管代码使用指针调用,那么可以在声明函数时用VC2005新增的__clrcall修饰符阻止编译器生成两个入口。
现在用简单的冒泡排序算法来比较一下使用__clrcall之后的性能改善程度。
using namespace System; #define ARRAY_SIZE 1000 struct bubbleBase { int value; }; class bubble1:public bubbleBase { public: virtual int getvalue(){return value;} virtual void setvalue(int newvalue){value=newvalue;} }; class bubble2:public bubbleBase { public: virtual int __clrcall getvalue(){return value;} virtual void __clrcall setvalue(int newvalue){value=newvalue;} }; template<class T> void bubbleSort(int length) { TimeSpan ts; T* array1=new T[ARRAY_SIZE]; for (int i=0;i<ARRAY_SIZE ;i++) { array1[i].setvalue(ARRAY_SIZE-i-1); } Int64 ticks=DateTime::Now.Ticks; int i, j,temp, test; for(i = length - 1; i > 0; i--) { test=0; for(j = 0; j < i; j++) { if(array1[j].getvalue() > array1[j+1].getvalue()) { temp = array1[j].getvalue(); array1[j].setvalue(array1[j+1].getvalue()); array1[j+1] .setvalue(temp); test=1; } } if(test==0) break; } ts=TimeSpan::FromTicks(DateTime::Now.Ticks-ticks); Console::WriteLine("BubbleSort {0} Items: {1} Ticks", ARRAY_SIZE, ts.Ticks ); delete array1; } int main(array<System::String ^> ^args) { bubbleSort<bubble1>(ARRAY_SIZE); bubbleSort<bubble2>(ARRAY_SIZE); return 0; }
运行结果是
BubbleSort 1000 Items: 3281250 Ticks
BubbleSort 1000 Items: 312500 Ticks
可以看到,__clrcall会大大加快在托管代码中调用托管函数的速度。
顺便说一下,在随VC8.0发布的STL中增加了很多安全特性,但是这也会造成程序的运行速度减慢。如果你确认程序不会有缓冲区溢出或者内存越界访问的问题,那么可以把_SECURE_SCL定义成0来关掉这个特性。参考