双字节字符集主要包含中文,日文和韩文.它由前导字节(Lead Byte) 和尾部字节(Trail Byte)构成, 由于一个字符采用了两个字节, 在软件的 国际化方面又增加了一些麻烦,比如在显示上, 光标的位置不能位于汉字 之间, 删除和移动时必须是整字操作等,在输入上, 一般需要预编辑服务器 才能输入汉字. 下表列出了中日韩语言编码的有关信息:
语言 | 字符集 | 代码页 | 前导字节范围 | 尾部字节范围 |
简体中文 | GB2312-1980 | CP936 | 0xA1-0xF7 | 0xA1-0xFE |
GBK | 无 | 0x81-0xFE | 0x40-0x7E, 0x80-0xFE | |
中文繁体 | BIG-5 | CP950 | 0x81-0xFE | 0x40-0x7E, 0xA1-0xFE |
日文 | Shift-JIS | CP932 | 0x81-0x9F, 0xE0-0xFC | 0x40-0xFC(0x7F除外) |
韩文 | KSC-5601-1987 | CP949 | 0x81-0xFE | 0x41-0x5A,0x61-0x7A,0x81-0xFE |
KSC-5601-1992 | CP1361 | 0x84-0xD3 0xD8 0xD90-0xDE 0xE0-0xF9 0x41,0xFE | 0x41-0x7E 0x81-0xFE 0x31-0x7E |