CLR via C# System.String 类型 构造字符串

许多编程语言(包括C#)都将String视为基元类型---也就是说。编译器允许在源代码中直接使用字面值(literal)字符串。编译器将这些字符串放到模块的元数据中,并在运行时加载和利用它们。

C#不允许使用 new 操作符从字面值字符串构造String对象:

相反,必须使用以下简化语法:

编译代码并检查 IL  :

用于构造对象的新实例的IL指令是 newobj 。但上述 IL 代码中并没有出现 newobj 指令,只有一个特殊 ldstr (即 load string)指令,它使用从元数据获得的字面值(literal)字符串构造 String 对象。这证明 CLR 实际是用一种特殊方式构造字面值 String 对象。

如果使用不安全的(unsafe)代码,可以从一个 Char* 或 Sbyte* 构造一个String。

C#提供了一些特殊语法来帮助开发人员在源代码中输入字面值(literal)字符串。对于换行符、回车符和退格符这样的特殊字符,C#采用的是C/C++开发人员熟悉的转义机制:

//--正确的字符串换行方式

上述代码虽然在字符串中硬编译了回车符和换行符,但一般不建议这样做。相反,System.Environment类型定义了只读NewLine属性。该属性对平台敏感,会根据底层平台来返回恰当的字符串。

//--

可以使用C#的+操作符将几个字符串连接成一个:

在上述代码中,由于所有字符串都是字面值,所以C#编译器能在编译时连接它们,最终只将一个字符串(即"Hi there.")放到模块的元数据中。对非字面值字符串使用+操作符,连接则在运行时进行。运行时连接不用使用+操作符,因为这样会在堆上创建多个字符串对象,而堆是需要垃圾回收的,对性能有影响。相反,应使用 System.Text.StringBuilder 类型。

最后,C#提供了一种特殊字符串声明方式。采用这种方式,引号之间的所有字符会被视为字符串的一部分,这种特殊声明称为“逐字字符串”(verbatim string),通常用于指定文件或目录的路径,或者与正则表达式配合使用。

以下代码展示了如何使用和不使用逐字字符串字符(@)来声明同一个字符串:

两种写法在程序集的元数据中生成完全一样的字符串,但后者可读性更好。在字符串之前添加@符号使编译器知道这是逐字字符串。编译器会将反斜杠字符视为字面值(literal)而非转义符,使文件路径在源代码中更易读。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值