为国际市场开发应用程序的一个重要方面就是要适当地表示本地字符集。
(一)单字节字符集(SBCS)
此字符集,只占用一个字节,主要是两种字符集ASCII和ANSI。
ASCII(American Standard Code for Information Interchange,美国信息互换标准代码),占用7位,共128个字符。在 0x00 到 0x7F 的范围内定义字符。
ANSI字符集(American National Standards Institute Processing--8-Bit Single-Byte Coded Craphic Character Sets),又叫扩展ASCII码,该字符集除了包含ASCII字符外,还有其他一些字符集(主要是欧洲字符)。在 0x00 到 0x7F 的范围内定义与 ASCII 字符集相同的字符,在 0x80 到 0xFF 的范围内定义了扩展字符集。因此,8 位的单字节字符集 (SBCS) 足以表示 ASCII 字符集以及许多欧洲语言的字符集。
(二)MBCS字符集(多字节字符集)
一些非欧洲字符集(如日文汉字)包含许多单字节代码方案无法表示的字符,因此要求使用多字节字符集 (MBCS) 编码。连续2个扩展ASCII码的扩展区域(0xA0以后)来表示一个汉字,该方法的标准叫GB-2312(国标),之后又扩展出GBK和GB18030。后来,日文、韩文、阿拉伯文、台湾繁体...都使用类似的方法扩展了本地字符集的定义,
(三)Unicode(宽字节字符集)
Unicode 是为所有语言提供足够编码的 16 位字符编码。所有 ASCII 字符都作为“加宽”字符包含在 Unicode 中。