Windows操作系统中使用的代码页
Windows平台上的GUI程序使用ANSI代码页,而在控制台程序使用OEM代码页(以便向后兼容)。这意味着,如果在记事本程序(notepad.exe)打开一个8位字符集编码的文本文件,将使用ANSI代码页;如果在命令行中用type命令显示这个文本文件的内容,将使用OEM代码页。这两个代码页在前128个字符的编码是一样的,但后128个字符的编码可能不一致。在Windows的命令行窗口通过标记、复制操作把一部分文本内容复制到记事本程序中,实际上是把Unicode格式的内容保存在剪贴板,使得这种文本复制保持了字符编码的透明转换。也就是说,在Windows的命令行窗口通过标记、复制操作把一部分文本内容复制到记事本程序就是先将Windows的命令行窗口复制过来的以多字节字符集编码的字符转换为该字符的Unicode字符集编码(由于现在的Windows版本本身是Unicode编码的版本)并将该字符的Unicode字符集编码保存在剪贴板,最后记事本程序再将保存在剪贴板的该字符的Unicode字符集编码(值)转换为记事本自己所用的多字节字符集的编码值。这里,Unicode字符集做了两个多字节字符集的编码值转换的中介,因为Unicode字符集可以和任意多字节字符集相互转换。这里两个多字节字符集间的编码值转换前提是转化它们都有的字符。