1.gbk:一个中文字符占两个字节,一个英文字符占一个字节,是转换成字节序列时的默认编码方式。
2.utf-8:一个中文字符占三个字节,一个英文字符占一个字节
3.utf-16be:java的编码方式,一个中文和一个英文字符都是占两个字节
4.字节序列转换成字符时要采用相同的编码方式,否则会乱码
2.utf-8:一个中文字符占三个字节,一个英文字符占一个字节
3.utf-16be:java的编码方式,一个中文和一个英文字符都是占两个字节
4.字节序列转换成字符时要采用相同的编码方式,否则会乱码
5.文本文件就是字节序列,可以是任意编码的字节序列,但是如果直接在中文机器上创建文本文件,那么该文本文件只认识ansi编码
<span style="font-size:24px;">import java.io.*;
public class javaIo1 {
public static void main(String[]rags)throws Exception{
String a="陕科大Abc";
byte[]bytes1=a.getBytes();
//转换成字节序列用的是项目默认的编码jbk
for(byte b:bytes1){
//把字节(转换成了int)以16进制的方式显示
System.out.print(Integer.toHexString(b&0xff)+" ");
}
System.out.println();
byte[]bytes2=a.getBytes("gbk");
//gbk编码中文占用2个字节,英文占用一个字节
for(byte b:bytes2){
System.out.print(Integer.toHexString(b&0xff)+" ");
}
System.out.println();
byte[]bytes3=a.getBytes("utf-8");
//utf-8编码中文占用3字节,英文占用1个字节
for(byte b:bytes3){
System.out.print(Integer.toHexString(b&0xff)+" ");
}
System.out.println();
//java是双字节编码 utf-16be
//utf-16be中文占用两个字节,英文也是占用2个字节
byte[]bytes4=a.getBytes("utf-16be");
for(byte b:bytes4){
System.out.print(Integer.toHexString(b&0xff)+" ");
}
System.out.println();
/***
*当你的字节序列是某种编码时,这个时候想把字节序列变成
*字符串,也需要用这种编码方式,否则会出现乱码
*/
String str1=new String(bytes4);
//用项目默认的编码
System.out.println(str1);
String str2=new String(bytes4,"utf-16be");
System.out.println(str2);
/***
* 文本文件 就是字节序列
* 可以是任意编码的字节序列
* 如果我们在中文机器上直接创建文本文件,那么该文本文件是认识ansi编码
* 联通、联是一种巧合,他们正好符合了utf-8的规则
* 文件编码:
*/
}
}
</span>