Java_IO流_“联通” “学习” 的编码问题

最新推荐文章于 2022-05-04 22:05:10 发布

tianshuang.me

最新推荐文章于 2022-05-04 22:05:10 发布

阅读量450

点赞数

本文链接：https://blog.csdn.net/u012552052/article/details/43339499

版权

新建文本文档，输入“联通”保存再打开后为乱码，输入“学习”也是如此，为什么呢？

package test;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;

public class test {

	public static void main(String[] args) throws IOException {
		FileInputStream fileInputStream = new FileInputStream("c:"
				+ File.separator + "迅雷下载" + File.separator + "新建文本文档.txt");
		int temp = 0;
		System.out.println("在此得到手动新建文本文档输入联通保存到硬盘上的字节码：");
		while ((temp = fileInputStream.read()) != -1) {
			System.out.println(Integer.toBinaryString(temp & 0xff));
		}
		System.out.println("----------------------------------------");

		String str = "联通";
		byte[] buf = str.getBytes("gbk");
		System.out.println("联通按GBK编码后的字节码，可知我们手动保存的文本文档是按照GBK保存的：");
		for (byte b : buf) {
			System.out.println(Integer.toBinaryString(b & 0xff));
		}
		System.out.println("----------------------------------------");

	}
}

输出：

在此得到手动新建文本文档输入联通保存到硬盘上的字节码：
11000001
10101010
11001101
10101000
----------------------------------------
联通按GBK编码后的字节码，可知我们手动保存的文本文档是按照GBK保存的：
11000001
10101010
11001101
10101000
----------------------------------------

我们再查阅Java的API文档得到UTF-8的解析原理：

'\u0001' 到 '\u007F' 范围内的所有字符都是用单个字节表示的：