代码实现之查询代码页的信息(附加:关于系统区域设置的说明)

本文详细介绍了Windows操作系统中GUI程序和控制台程序分别使用的ANSI和OEM代码页,以及如何根据系统区域设置来适应非Unicode程序。讨论了如何查询代码页信息,重点在于控制台程序中`chcp`命令的作用。此外,还解释了系统区域设置的选择与非Unicode程序的字符编码关系,以及如何更改这些设置。最后提到了Windows记事本在处理ANSI和Unicode编码时的机制。
摘要由CSDN通过智能技术生成

Windows操作系统中使用的代码页

Windows平台上的GUI程序使用ANSI代码页,而在控制台程序使用OEM代码页(以便向后兼容)。这意味着,如果在记事本程序(notepad.exe)打开一个8位字符集编码的文本文件,将使用ANSI代码页;如果在命令行中用type命令显示这个文本文件的内容,将使用OEM代码页。这两个代码页在前128个字符的编码是一样的,但后128个字符的编码可能不一致。在Windows的命令行窗口通过标记、复制操作把一部分文本内容复制到记事本程序中,实际上是把Unicode格式的内容保存在剪贴板,使得这种文本复制保持了字符编码的透明转换。也就是说,在Windows的命令行窗口通过标记、复制操作把一部分文本内容复制到记事本程序就是先将Windows的命令行窗口复制过来的以多字节字符集编码的字符转换为该字符的Unicode字符集编码(由于现在的Windows版本本身是Unicode编码的版本)并将该字符的Unicode字符集编码保存在剪贴板,最后记事本程序再将保存在剪贴板该字符的Unicode字符集编码(值)转换为记事本自己所用的多字节字符集的编码值。这里,Unicode字符集做了两个多字节字符集的编码值转换的中介,因为Unicode字符集可以和任意多字节字符集相互转换。这里两个多字节字符集间的编码值转换前提是转化它们都有的字符。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值