分别用字节流和字符流读取www.baidu.com的页面源码,我是这样做的
import java.io.IOException;
import java.io.InputStream;
import java.net.MalformedURLException;
import java.net.URL;
/**
* 测试字节流和字符流读取站点数据时的区别
* 现象:用字符流读取时,中文出现乱码
*
* 猜想:字符流读取,字符错位引起的
* @author ayis
* Mar 13, 2009
*/
public class Test {
public static void main(String args[]){
try {
URL url = new URL("http://www.baidu.com");
InputStream in = url.openStream();
int n;
StringBuffer buffer = new StringBuffer();
// 用字节流读取
while((n= in.read()) != -1){
buffer.append((char)n);
}
用字符流读取
//BufferedReader reader = new BufferedReader(new InputStreamReader(in));
//while((n = reader.read()) != -1){
//buffer.append((char)n);
//}
// 转码并打印结果
String response = new String(buffer.toString().getBytes("iso-8859-1") , "GBK");
System.out.println(response);
} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
如现在程序这样的,用字节流读取时,都是正常的,中文未出现任何乱码;如果相应去掉注释,用字符流读取,中文就出现了乱码,如:
????????? 。另外,试着使用BufferedReader的readerLine(),或者去掉BufferedReader直接使用InputStreamReader,均照样出现中文乱码。
我想知道,使用字节流读取数据时,稳当当的,使用字符流时,怎么中文就出现了乱码???