bit(位)
1bit = 1位二进制数
数据存储的最小单位,一个二进制数据0或1就代表一位
byte(字节)
1byte = 8bit
存储空间的基本计量单位
(1)一个英文字母占一个字节:1字母 = 1byte = 8bit
(2)一个汉字占2个字节:一个汉字 = 2byte = 16bit
(3)标点符号:汉字输入状态下,默认为全角输入,占2位字节
(4)标点符号:英文输入状态下,默认为半角输入,占1位字节
(5)mysql 4.0以下版本中,varchar(50)就代表50个字节,如果存放utf8汉字时,只能存放16个(每个汉字3字节)
字符
1个汉字 = 一个字符 = 2byte
字符(Character)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。a、A、中、+、*、の…均表示一个字符
(1)utf-8编码下,一个汉字占位3个字节
(2)gbk编码下,一个汉字占位2个字节
(3)mysql 5.0版本以上,varchar(50) 指的是50字符,无论存放的是数字、字母还是UTF8汉字(每个汉字3字节),都可以存放50个
字符集
字符集(Character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode字符集等
字符编码
字符编码(英语:Character encoding)也称字集码,是把字符集中的字符编码为指定集合中某一对象(例如:比特模式、自然数序列、8位组或者电脉冲),以便文本在计算机中存储和通过通信网络的传递