C# 读取字符串的字节长度

最新推荐文章于 2024-04-15 15:38:52 发布

weixin_30915275

最新推荐文章于 2024-04-15 15:38:52 发布

阅读量432

点赞数

文章标签： c# 游戏

原文链接：http://www.cnblogs.com/serafin/archive/2012/07/13/2589794.html

版权

昨天在尝试写点代码的时候碰到需要读取字符串的字节长度的问题（一个汉字算两个字节），于是小研究了一下。。。这里些点小笔记记录一下，方便日和查看或者别人查阅。

在C#里面我们可以通过字符串的Length属性读取字符串的长度，但众所周知，通过这个属性读出来的话不管中文还是英文或者数字，一个字就是一个长度，这并不是我们想要的结果。正确的方法应该是指定编码格式，然后通过编码的GetBytes方法来读取长度。于是写了一个控制台程序用于比较各种编码读取长度的不同，代码如下：

c#代码

 
          string 
          text =  
          " 【中文】（12.21）(ァぁ)[En] " 
          ; 
         
          var String_Len = text.Length; 
         
          var ASCII_Len = Encoding.ASCII.GetBytes(text).Length; 
         
          var Default_Len = Encoding.Default.GetBytes(text).Length; 
         
          var BigEndianUnicode_Len = Encoding.BigEndianUnicode.GetBytes(text).Length; 
         
          var Unicode_Len = Encoding.Unicode.GetBytes(text).Length; 
         
          var UTF32_Len = Encoding.UTF32.GetBytes(text).Length; 
         
          var UTF7_Len = Encoding.UTF7.GetBytes(text).Length; 
         
          var UTF8_Len = Encoding.UTF8.GetBytes(text).Length; 
         
          var GB2312_Len = Encoding.GetEncoding( 
          "GB2312" 
          ).GetBytes(text).Length; 
         
          var strFm= 
          "{0} \t: {1}" 
          ; 
         
          Console.WriteLine(strFm,  
          "String.Length" 
          , String_Len); 
         
          Console.WriteLine(); 
         
          Console.WriteLine(strFm,  
          "系统默认编码" 
          , Default_Len); 
         
          Console.WriteLine(); 
         
          Console.WriteLine(strFm,  
          "GB2312编码" 
          , GB2312_Len); 
         
          Console.WriteLine(); 
         
          Console.WriteLine(strFm,  
          "ASCII编码" 
          , ASCII_Len); 
         
          Console.WriteLine(strFm,  
          "BigEndianUnicode编码" 
          , BigEndianUnicode_Len); 
         
          Console.WriteLine(strFm,  
          "Unicode编码" 
          , Unicode_Len); 
         
          Console.WriteLine(strFm,  
          "UTF32编码" 
          , UTF32_Len); 
         
          Console.WriteLine(strFm,  
          "UTF7编码" 
          , UTF7_Len); 
         
          Console.WriteLine(strFm,  
          "UTF8编码" 
          , UTF8_Len);