今天上午写了一个实用虚拟登陆获得网站内容的例子,使用StreamReader读取出网页内容后发现竟然是乱码,在网上找了好长时间才发现,原来是编码格式的问题
引用:(来自一剪梅)
******
究其原因,原来自从Windows 2000之后的操作系统在文件处理时默认编码采用Unicode,所以.Net 的文件默认编码也是Unicode。除非另外指定,StreamReader 的默认编码为 Unicode,而不是当前系统的 ANSI 代码页。但是文档大部分还是以ANSI编码储存,中文文本使用的是gb2312,所以才造成中文乱码的状况,也就是说在读取文本的时候要指定编码格式。
******
解决方法是System.Text.Encoding.Default 将StreamReader的编码格式设定为系统当前默认的编码格式就好了!
StreamReader reader = new StreamReader(FileName, System.Text.Encoding.Default)