每一个编码对应不同的字符集:
制定了编码,它所对应的字符集也就指定了,所以编码才是最终要关心的
ASCII字符集:美国信息交换标准代码
ISO:拉丁编码
GBXX:GB是国际的意思,为了显示中文而设计的一套字符集
GBK:最常用的中文码表
Unicode字符集:表达任意语言的任意字符。最常用的是UTF8编码。工作中最多。
GBK是两个字节存储一个汉字,UTF-8是三个字节来存储一个汉字。
编码引出的问题:
FileReader可以读取IDE默认编码格式(UTF-8)的文件
FileReader读取系统默认编码(中文GBK)会产生乱码
转换流:
1.InputStreamReader:
可以查询IDE默认码表,把字节转换为字符,解码。
是字节流通向字符流的桥梁。可以指定编码表,
1.构造方法
2.参数
代码实现
2.OutPutStreamWriter:
可以查询IDE默认码表,把字符转换为字节,编码。能看懂的变成看不懂的。