Encoding 类

表示字符编码。

有关此类型所有成员的列表,请参阅 Encoding 成员

System.Object
   System.Text.Encoding
      System.Text.ASCIIEncoding
      System.Text.UnicodeEncoding
      System.Text.UTF7Encoding
      System.Text.UTF8Encoding

[Visual Basic]
<Serializable>
MustInherit Public Class Encoding
[C#]
[Serializable]
public abstract class Encoding
[C++]
[Serializable]
public __gc __abstract class Encoding
[JScript]
public
   Serializable
abstract class Encoding
线程安全

此类型的所有公共静态(Visual Basic 中为 Shared)成员是线程安全的。但不保证任何实例成员是线程安全的。

备注

提供了将 Unicode 字符的数组和字符串与针对目标代码页编码的字节数组互相转换的方法。

System.Text 命名空间提供了若干 Encoding 实现,包括:

ASCIIEncoding 类将 Unicode 字符编码为单个的 7 位 ASCII 字符。此编码仅支持 U+0000 和 U+007F 之间的字符值。

UnicodeEncoding 类将每个 Unicode 字符编码为两个连续的字节。支持 Little-Endian(代码页 1200)和 Big-Endian(代码页 1201)字节顺序。

UTF7Encoding 类使用 UTF-7 编码(UTF-7 代表 7 位形式的 UCS 转换格式)对 Unicode 字符进行编码。此编码支持所有 Unicode 字符值,并且还可以按代码页 65000 访问。

UTF8Encoding 类使用 UTF-8 编码(UTF-8 代表 8 位形式的 UCS 转换格式)对 Unicode 字符进行编码。此编码支持所有 Unicode 字符值,并且还可以按代码页 65001 访问。

使用带有代码页或名称参数的 GetEncoding 方法来获取其他编码。

当要转换的数据仅在连续块(如从流中读取的数据)中可用时,应用程序可以使用 DecoderEncoder 执行转换。这在数据量大到需要分成较小的块时也很有用。解码器和编码器通过 GetDecoderGetEncoder 方法获取。应用程序可使用此类的属性(如 ASCIIDefaultUnicodeUTF7UTF8)来获取编码。应用程序可通过 ASCIIEncodingUnicodeEncodingUTF7EncodingUTF8Encoding 类初始化 Encoding 对象的新实例。

通过编码,GetBytes 方法用于将 Unicode 字符数组转换为字节数组,而 GetChars 方法用于将字节数组转换为 Unicode 字符数组。GetBytesGetChars 方法在转换之间不维护状态。

核心 GetBytesGetChars 方法要求调用方提供目标缓冲区并确保该缓冲区大到足以容纳整个转换结果。应用程序可使用下列方法之一来计算目标缓冲区所需的大小。

  1. 可以用 GetByteCountGetCharCount 方法计算某个特定转换结果的精确大小,然后就可以为该转换分配大小合适的缓冲区。
  2. GetMaxByteCountGetMaxCharCount 方法可用于计算给定字节或字符数的转换的最大大小,这样该大小的缓冲区就可以重复用于多次转换。

第一个方法通常使用较少的内存,而第二个方法通常执行得更快。

网友netstarry写的一个处理字符编码的,很好的解决了php中字符转换的问题 前一阵子见到了qiushuiwuhen君的关于gbk,unicode,big5的转换的文章 但是多少有一些不太大的问题 于是我设计了一个负责字符转换的,修正了其中的一些不足,增加了部分功能,以后我会不断扩充该,来支持更多的字符集 增加了如下几点: unicode->gbk 符号部分的转换 欧元符(?的识别 big5,Unicode,GBK之间的相互转换,前提是只转换共同的字符集部分, 使用说明: 暂时程序支持以下字符编码方式: GBK,BIG5,UTF-16BE(Unicode big-endian字节顺序),UTF-16LE(Unicode little-endian字节顺序),UTF-8 默认输入编码方式为GBK,默认输出编码方式为UTF-16BE; 该别提供两个函数用来修改输入和输出编码方式: 修改输入编码方式 boolean SetGetEncoding(string $GetEncoding) 修改输出编码方式 boolean SetToEncoding(string $ToEncoding) 函数参数只能使用上述5种编码方式,区分大小写,如GBK不能写成gbk 如果设置成功,返回true,如果使用了错误的编码名,返回false,并现实错误信息 函数 string EncodeString(string $String) 负责进行字符编码转换,返回转换后的字符串 使用前,请将var $FilePath=\"\"变量该为该程序文件的绝对路径,否则将会找不到数据文件 例子: 将gbk编码的字符串转化为UTF-8编码: $s=\"GBK编码\"; $CharEncoding=new Encoding(); $CharEncoding->SetGetEncoding(\"GBK\")||die(\"编码名错误\"); $CharEncoding->SetToEncoding(\"UTF-8\")||die(\"编码名错误\"); echo $CharEncoding->EncodeString($s); 在浏览器中使用UTF-8编码察看,将会看到正确的字符.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值