Java学习笔记 -- IO专题(一)文件编码

最新推荐文章于 2024-08-12 22:20:16 发布

Chook_lxk

最新推荐文章于 2024-08-12 22:20:16 发布

阅读量194

点赞数 1

分类专栏： Java学习文章标签： Java IO 编码

本文链接：https://blog.csdn.net/l1832876815/article/details/85327442

版权

Java学习专栏收录该内容

18 篇文章 16 订阅

订阅专栏

1. 文件编码

Java默认编码方式是项目所用的GBK编码，可以看出汉字占用了两个字节，字母占用了一个字节

String str = "练习AB";
byte[] bytes = str.getBytes();
for(byte b : bytes) {
	System.out.print(Integer.toHexString(b & 0xff) + " ");
	//c1 b7 cf b0 41 42 
}

utf-8编码是Linux中的默认编码方式，其中汉字占三个字节，字母占一个字节

String str = "练习AB";
byte[] bytes = str.getBytes("utf-8");
for(byte b : bytes) {
	System.out.print(Integer.toHexString(b & 0xff) + " ");
	//e7 bb 83 e4 b9 a0 41 42 
}

Java采用utf-16be双字节编码，一个汉字占两个字节，字母占两个字节

String str = "练习AB";
byte[] bytes = str.getBytes("utf-16be");
for(byte b : bytes) {
	System.out.print(Integer.toHexString(b & 0xff) + " ");
	//7e c3 4e 60 0 41 0 42 
}

编码和解码要用相同的编码格式，否则出现乱码

String str = "练习AB";
byte[] bytes = str.getBytes("utf-8");
		
String ans = new String(bytes);//默认用项目的编码方式GBK
System.out.print(ans);
//缁冧範AB
String ans_1 = new String(bytes,"utf-8");
System.out.print(ans_1);
//练习AB