有时在用C#中StreamReader读取中文时出现乱码
如:
- using System;
- using System.Collections.Generic;
- using System.Linq;
- using System.Text;
- using System.Diagnostics;
- using System.Net;
- using System.Data.Sql;
- using System.Collections;
- using System.Data.SqlClient;
- using System.IO;
- using System.Diagnostics;
- namespace ConsoleApplication1
- {
- class Program
- {
- static void Main(string[] args)
- {
- try
- {
- FileStream fs = new FileStream("1.txt", FileMode.Open, FileAccess.Read);
- StreamReader read = new StreamReader(fs);
- string str;
- while (read.Peek() != -1)
- {
- str = read.ReadLine();
- Console.WriteLine(str);
- }
- read.Close();
- }
- catch (Exception ex)
- {
- Console.WriteLine(ex.Message);
- }
- }
- }
- }
![](https://img-my.csdn.net/uploads/201206/13/1339580330_1442.jpg)
原因是自Windows 2000之后的操作系统在文件处理时默认编码采用Unicode
所以.NET文件的默认编码也是Unicode。除非另外指定,StreamReader的默认编码为Unicode,
而不是当前系统的ANSI代码页。但是文档大部分还是以ANSI编码存储,中文文本使用的是GB2312,所以才造成中文乱码
所以在读取文本的时候要指定编码格式。
使用System.Text.Encoding.Defaul告诉StreamReader采用目前操作系统的编码即可。
如:
- FileStream fs = new FileStream("1.txt", FileMode.Open, FileAccess.Read);
- StreamReader read = new StreamReader(fs, Encoding.Default);
- string str;
- while (read.Peek() != -1)
- {
- str = read.ReadLine();
- Console.WriteLine(str);
- }
- read.Close();
![](https://img-my.csdn.net/uploads/201206/13/1339580489_1539.jpg)