1.位(bit)
位:bit,“比特”,计算机内部数据存储的最小单位。位只可用二进制数0和1两种状态表示。
2.字节(byte)
字节(Byte)是一种计量单位,表示数据量多少,它是计算机用于计量存储容量的一种计量单位。字节是计算机中数据处理的基本单位。计算机中以字节为单位存储和解释信息,规定一个字节由八个二进制位构成,即1个字节等于8个比特(1byte=8bit)。
1 B = 1 byte(字节) = 8 bit;
1 KB = 1024 B(字节);
1 MB = 1024 KB;(2^10 B)
1 GB = 1024 MB;(2^20 B)
1 TB = 1024 GB;(2^30 B)
3.字符(char)
a、A、中、+、*、の......均表示一个字符;字符:指计算机中使用的字母、数字、字和符号。即计算机中使用的文字和符号。
utf-8 编码,一个汉字 字符 占用 3 个 字节,一个英文字符占1个字节;
gbk 编码下,一个汉字 字符 占用 2 个 字节,一个英文字符占1个字节;
4.字符集
字符的集合,将可读的字符使用计算机的数据存储形式表示(二进制位,称为码值)。例如:‘a’在字符集中使用‘97’(码值)表示,‘A’在字符集中对应的码值为‘65’。这样就出现了相同字符在不同字符集中对应的码值可能不同,就出现了乱码现象,所以出现了Unicode字符集,将各种汉字,字母(A、b、c)或符号(空格、引号..)都收入其中,万国码表,统一字符的码值。
5.编码
规定字符对应字符集中的码值用几个字节存储。例如:Unicode字符集规定了'杨'的码值为‘26472’,但没有声明用几个字节存储,用2个字节可以,3个字节也可以,所以有了编码规则。例:utf-8、utf-16。有了规则,编码、解码就会根据规则进行计算机数据的存储与读取,解决乱码现象。