一、
- 字符:由数字,字母,标点符号,各种符号。。。组成的都叫做字符。
- 字节:字节是计算机中存储容量的基本单位,1字节是在计算机中是8位。也就是从 00000000到11111111。在计算机里面,无论你什么样的文件,到最后都会被转为0,1的组成序列来表示,那么问题来了,我们肯定要制定规则呀,比如00011001代表哪个字符,这些都是我们人为后面规定的,所以我们就引入了编码格式:ANCI、UTF-8、GBK、UTF-16、UTF-32…等等很多很多编码格式就应运而生。
3.编码格式:ANCI、UTF-8、GBK、UTF-16、UTF-32…。记住一句话,这些编码格式作用就是:一个字符在计算机中到底占几个字节。不同的编码格式对这个的规定是不一样的。
1、ANCI编码码中:标点符号、数字、大小写字母都占一个字节,汉字占2个字节。
一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制。最小值0,最大值255。
2、UTF-8编码中:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。
3、Unicode编码中:一个英文字符等于两个字节,一个中文(含繁体)等于两个字节。
符号:英文标点占一个字节;中文标点占两个字节。
举例:英文句号“.”占1个字节的大小;中文句号“。”占2个字节的大小。
4、UTF-16编码中:一个英文字母字符或一个汉字字符存储都需要2个字节(Unicode扩展区的一些汉字存储需要4个字节)。
5、UTF-32编码中:世界上任何字符的存储都需要4个字节。
6、GBK编码中:英文字符1个字节,中文字符2个字节.
总结
以前我基本上看到字符字节就躲着它们,后来实在躲不了,今天和它们做个了断,如果我说的不对,请赐教。