package 字符串;
//一个16位Unicode码占两个字节,用以"\ u"开头的4位16进制数表示,范围从\u0000到\uFFFF,65536个字符
//Unicode只有一个字符集,中文、日文、韩文三种文字一齐占用了Unicode中0x3000到0x9FFF的部分。
//Unicode目前普遍采用的是UCS-2标准,它用两个字节来编码一个字符, 比如汉字"经"的编码是0x7ECF。
//因为字符码一般用十六进制来表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换成十进制即是32463.
//UCS-2用两个字节来编码字符,两个字节就是16位二进制, 2的16次方等于65536,所以UCS-2最多能编码65536个字符。
//编码从0到127的字符与ASCII编码的字符一样,比如字母"a"的Unicode编码是0x0061,对应的十进制是97,
//而"a"的ASCII编码是0x61,对应的十进制也是97,。
//实际上Unicode对汉字的支持与编码并不怎么好,这也是没办法的。
//简体汉字和繁体汉字加在一起总共有六七万个,而UCS-2最多只能表示65536个字符,
//所以Unicode只能通过排除一些几乎不用的汉字的方法以能够表达其余常用汉字,好在常用的简体汉字只有七千多个。
//为了能表示所有汉字,Unicode也有UCS-4规范,就是用 4个字节来编码字符,
//在这种规范下,大部分来自不同国家和地区的可读字符都可以被表达出来。
//大多数计算机采用ASCII码,它是表示所有大小写字母,数字,标点符号,和控制字符的8位编码表
//Unicode码包括ASCII码,从\ u0000到\u007F对应128个ASCII码
public class 字符介绍 {
public static void main(String[] args) {
System.out.print("A"+'\u0000'+"B");
}
}
Java初学笔记——9.字符介绍
最新推荐文章于 2022-05-12 10:49:06 发布