Bit(binary digit二进制数,比特)
电脑数据量的最小单位,二进制系统中每个1或0就是一个位(bit)
1 Byte = 8 bit
1 KB = 1024 Byte
1 MB = 1024 KB
1 GB = 1024 MB
1 TB = 1024 GB (10TB大约等于一个人脑的存储量)
ASCII
原始 7位二进制表示字符
现代 8位二进制表示字符
中文 2个byte字节表示
标准ASCII表:http://baike.baidu.com/view/15482.htm
ISO8859-1 (8位二进制,1个byte字节表示字符)
加入αβγ(西方文字)
Unicode(16位二进制,2个byte字节表示字符,又叫万国码)
UTF-8
中文 3个byte字节表示
αβ 2个byte字节表示
英文,数字 1个字节表示
其他
GBK
中文 2个byte字节表示
其他 1个byte字节表示
Java编码
所有字符 2个byte字节表示
关于字母:
大写字母和小写字符之间数值上差32
a 是 97;A是65
获取content-length 字符串的长度:
length = result.getBytes("utf-8").length();
面试题:
1. char型变量中能不能存贮一个中文汉字?
在C语言中,char类型占1一个字节,而汉子占2个字节,所以不能存储。
在Java中,char类型占2个字节,而且Java默认采用Unicode编码,以个Unicode码是16位,所以一个Unicode码占两个字节,Java中无论汉字还是英文字母都是用Unicode编码来表示的。所以,在Java中,char类型变量可以存储一个中文汉字。