编码
编码表由世界的字符和对应的数值组成的一张表
ASCII码:最早出来的编码表,由一个字节,最高位是字符位,其他七位是代表数值位
‘a’:97
‘A’:65
‘0’:48
中文编码表:GB2312、GBK、GB18030(取代GBK)、BIG-5(繁体)
Unicode:国际标准码,融合所有文字
互相转换会乱码
英文:一个字符一字节
中文:
UTF-8:一个汉字3字节
GBK:一个汉字2字节
String类
成员方法
byte[] getBytes()使用平台的默认字符集将此 String 编码为 byte 序列,并将结果存储到一个新的 byte 数组中
byte[] getBytes(Charset charset) 使用给定的 charset 将此 String 编码到 byte 序列,并将结果存储到新的 byte 数组
例如:
byte[] bs = string.getBytes("GBK");
byte[] bs = string.getBytes("UTF-8");
构造方法
String(byte[] bytes) 通过使用平台的默认字符集解码指定的 byte 数组,构造一个新的 String
String(byte[] bytes, Charset charset) 通过使用指定的 charset 解码指定的 byte 数组,构造一个新的 String
注意:编码和解码所用的编码要一致
例如:
String string="哈哈";
byte[] bs=string.getBytes();
System.out.println(Arrays.toString(bs));
try {
String string2 = new String(bs, "UTF-8");
System.out.println(string2);
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}