好记性不如赖笔头…………
常见字符编号如下:
1.Acsii码:使用7bit来存储数据
2.IOS-8859-1:拉丁码表,用8bit来存储数据
3.GB2312:简体中文编码(国标码)
4.GBK:在GB2312上做了增强
5.GB18030:对GBK做了增强,支持繁体
6.Unicode:支持多个国家的语言,是国际标准,用2个字节来存储,不管是什么字符都用两个字节来存储,会浪费存储空间
7.UTF-8:支持多个国家的语言,针对不同的字符范围给出不同的字节存储空间
package com.Ckinghan.charset;
import java.io.UnsupportedEncodingException;
public class StringCharsetDemo {
/**
* @描述:字符的编号码
* @创建时间:
*/
public static void main(String[] args) {
String string = "小二,上怀荼";
/**
* 默认GBK编码,默认的编码跟建立项目时设置的编码相同
*/
byte[] bs = string.getBytes();
System.out.println(new String(bs));
try {
/**
* 将字符转换为UTF-8编码
*/
byte[] bs2 = string.getBytes("UTF-8");
System.out.println(new String(bs2, "UTF-8"));
/**
* 将字符转换为Unicode编码,然后以Unicode编码的方法转换为字符串输出
*/
byte[] bs3 = string.getBytes("Unicode");
System.out.println(new String(bs3, "Unicode"));
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
}
}
执行结果:
小二,上怀荼
小二,上怀荼
小二,上怀荼