经常碰到一些 CHM 格式的帮助文档出现乱码无法阅读的情况,而且 CHM 文档不像浏览器一样,右键可以选择字符编码,非常不便。究其原因,主要就是 CHM 文档在页面中没有指定合适的字符编码所致。
CHM 的实质是 HTML 文件。一般情况下没有指定字符编码的 CHM 是调用 Internet Explorer 浏览器的字符编码设定来显示 CHM 文件的。
在注册表 HKEY_CURRENT_USERSoftwareMicrosoftInternet ExplorerInternational 下有 AutoDetect 和 Default_CodePage 2个键名,就是 IE 浏览器字符编码的相关设定键。 其中:AutoDetect 是表示自动侦测字符编码的意思。同 IE 浏览器“查看”菜单的“编码”中的“自动选择”。键值设置1,表示启用自动侦测。一般的,简体中文的操作系统,IE 浏览器就会使用 GB2312 去显示那些没有指定字符编码的页面。如果 AutoDetect 设置为0,那浏览器会去使用 Default_CodePage 的设定来显示页面。 因此,我们在简体中文的操作系统上打开简体中文的 CHM 文档出现乱码时,把 AutoDetect 设置为1就能正常显示;在简体中文的操作系统上打开繁体中文的 CHM 文档出现乱码时,先把 AutoDetect 设置为0,然后把 Default_CodePage 设置为 BIG5 的代码页 950 即可。
简体中文Windows常用 ANSI 代码页936,在注册表二进制值是 A8 03 00 00;
繁体中文Windows常用 ANSI 代码页950,在注册表二进制值是 B6 03 00 00;
拉丁语系Windows常用 ANSI 代码页1252,在注册表二进制值是 E4 04 00 00
由于所用为日文系统,有时打开中文chm会有乱码。也有例外,应为chm编译时的编码选择的问题。
还有一种方法,打开chm后,在首页面看其属性,将路径直接copy到浏览器地址栏,此种方法的缺陷是有时得到的路径中含有乱码,那就。。。。。。。
mk:@MSITStore:X:xxxBash1.chm::/index.html
有关于字符编码的文章。