字符串应该是所有编程语言中使用最频繁的一种基础数据类型。如果使用不慎,我们就会为一次字符串的操作所带来的额外性能开销而付出代价。
建议从两个方面来探讨如何规避这类型的性能开销:
1.确保尽量少的装箱
2.避免分配额外的内存空间
比如下面的两行代码:
String str1 = "str1" + 9;
String str2 = "str2" + 9.ToString();
我们知道第一行代码在运行时,会完成一次封箱行为;而第二行代码中的9.ToString()并没有发生封箱行为,它实际调用的是整型的ToString方法,而ToString方法的原型为:
public override String ToString()
{
return Number.FormatInt32(m_value, null, NumberFormatInfo.CurrentInfo);
}
有人会问是不是原型中的FormatInt32方法会发生封箱行为呢?实际上,那是一个非托管的方法,它是直接操作内存来完成从int到string的转换,效率要比装箱高很多。所以在使用其他值引用类型到字符串的转换并完成拼接是,应当避免使用操作符“+”来完成,而应该使用值引用类型提供的ToString方法。
这里有一个指导原则: 在自己编写的代码中,应当尽可能地避免编写不必要的装箱代码
装箱之所以会带来性能损耗,因为它需要完成下面的三个步骤:
- 首先,会为值类型在托管堆中分配内存。除了值类型本身所分配的内存外,内存总量还要加上类型对象指针和同步块索引所占用的内存。
- 将值类型的值复制到新分配的堆内存中。
- 返回已经成为引用类型的对象的地址。
另外,避免非配额外的内存空间。 对CLR来说,string对象是个很特殊的对象,它一旦被赋值就不可改变。在运行时调用System.String类中的任何方法或进行任何运算(如“=”赋值、“+”拼接等),都会在内存中创建一个新的字符串对象,也意味着要为该新对象分配新的内存空间。
private static void NewMethod1()
{
string s1 = "abc";
s1 = "123" + s1 + "456"; //以上两行代码创建了3个
//字符串对象,并执行了一次string.Contact方法
}
private static void NewMethod6()
{
string re6 = 9 + "456"; //该代码发生一次装箱,并调
//用一次string.Contact方法
}
//而以下代码中,字符串不会在运行时拼接字符串,而是会在编译时直接生成一个字符串
private static void NewMethod2()
{
string re2 = "123" + "abc" + "456"; //该代码等效于
//string re2 = "123abc456";
}
private static void NewMethod9()
{
const string a = "t";
string re1 = "abc" + a; //因为a是一个常量,所以
//该代码等效于 string re1 = "abc" + "t";
//最终等效于string re1 = "abct";
}
为了避免System.String类带来的性能损耗,微软提供了StringBuilder来弥补String的不足。SB不会重新创建一个string对象,它的效率源于预先以非托管的方式分配内存。如果未定义sb的长度,则默认分配16.小于16时便不再分配,若大于16,系统会分配16的倍数。
private static void NewMethod8()
{
string a = "t";
a += "e";
a += "s";
a += "t";
}
private static void NewMethod7()
{
string a = "t";
string b = "e";
string c = "s";
string d = "t";
string result = a + b + c + d;
}
//上面两种方式的效率都不高。不要以为前者比后者创建的字符串对象更少,
//实际上,两者创建的字符串对象相等,而且前者进行了3次string.Contact方法调用,比后者还多了两次。
private static void NewMethod10()
{
//为了演示必要,定义了4个变量
string a = "t";
string b = "e";
string c = "s";
string d = "t";
StringBuilder sb = new StringBuilder(a);
sb.Append(b);
sb.Append(c);
sb.Append(d);
//再次提示,是运行时,所以没有使用下面的代码
//StringBuilder sb = new StringBuilder("t");
//sb.Append("e");
//sb.Append("s");
//sb.Append("t");
string result = sb.ToString();
}
//或者使用string.Format方法。
private static void NewMethod11()
{
//为了演示必要,定义了4个变量
string a = "t";
string b = "e";
string c = "s";
string d = "t";
string.Format("{0}{1}{2}{3}", a, b, c, d);
}
读《改善C#程序的157个建议》笔记抄录。