昨天在调试页面源码获取程序
本来想用VS2005开发的,但是发现通过VC中的CInternetSession获取源码时总是出现乱码
仔细的跟踪程序中也是,查阅了很多文档,尝试了很多方法
后来将项目属性中的字符集由原来的使用Unicode字符集修改成未设置
再次获取源码的时候程序就不在出现乱码了
仔细分析原因可能是网页源码中使用的ANSI字符集和Unicode字符集混合的
全部采用Unicode编码对ANSI字符编码支持不到位,修改程序编译成未设置之后,编译器会先尝试默认的ANSI编码
如果无法处理再采用Unicode编码进行处理,这样无形中增强了对数据编码的兼容性