通过官方文档可知一行最多存65535个字节。

 utf-8 字符测试

1 建表  一个汉字在utf-8中占3个字节

通过计算65535/3 可以得出每行最多存21845,建表 

%E6%9C%80%E5%A4%A7%E5%AD%97%E7%AC%A6%E5%

创建失败 原因是varchar(N)的前两个字符是表是varchar的长度。字符为空时存储是从第二位是从第2位开始,也就是N=(65535-2-1)/3 =21845

%E6%9C%80%E5%A4%A7%E5%AD%97%E7%AC%A6-1.j

 2 插入数据比较表的字节变化

查看空表所占字节       空表所占字节 16384

%E7%A9%BA%E8%A1%A8.jpg?version=1&modific

插入数据 

%E6%8F%92%E5%85%A5.jpg?version=2&modific

查看表的变化并计算 (备注这是测试中插入两行后的要除2)

%E8%8C%B6%E5%90%8E.jpg?version=1&modific

计算表的大小147456/2-16384-1=65535 (1 是表中标注1行占用的字节)

字符数查看 select char_length(a1),length(a1) from tb_utf8;

%E5%AD%97%E7%AC%A6%E6%95%B0.jpg?version=

验证验证为空和不为空时字符占用

varchar (21844) 后正好占用65533个字节 tinyint类型占用一个自己  65535=65532+2+1

%E4%B8%8D%E4%B8%BA%E7%A9%BA.jpg?version=

varchar 为空时验证

%E7%A9%BA.jpg?version=1&modificationDate

可以用看出为空需要一个字节去标示,表不能创建

 

结论: varchar 在utf-8中一个汉字占用3个字节, 数字和字母都占用一个字节。 为空需要一个字节去标示。

 

gbk 字符集测试

建表: 根据gbk编码一个汉字占用2个字节,一行最多有65535个字节和上边测试的为空时多占一个字节。可以计算出varchar(N)  N在 varchar在为空和非空的值

为空 (65535-2-1)/2 = 32766个汉字     非空 (65535-2)/2=32766.5 也就是非空状态下可以多建一个tinyint类型

varchar为空建表

k.jpg?version=1&modificationDate=1432021

varchar 非空建表

fk.jpg?version=1&modificationDate=143202

注释: 在建表时如果varchar超过规定字节数时会默认转换字符类型

c.jpg?version=1&modificationDate=1432021

插入数据后查看插入数据量

%E6%8F%92%E5%85%A5.jpg?version=2&modific

查看数据占用的字节

插入前表

q.jpg?version=1&modificationDate=1432022

插入后

h.jpg?version=1&modificationDate=1432022

结论: 在gbk字符中varchar(N) ,N<=23766个汉字 。如果N 大于32766 mysql 会默认的转换字符类型。 gdk中能存32766个汉字或者数字字母。

 

latin1 字符集 测试

1character=1byte, 1汉字=2character,

建表   因为在latin1 中一个字节=1个字符 ,建表时varchar(N) N 在varchar不为空的时 N=65533 为空时N=65532

 

1.jpg?version=1&modificationDate=1432027

分别插入字母和汉字查看插入数据结果

j1.jpg?version=1&modificationDate=143202

可以看到插入的字符和汉字情况 通过计算插入汉字65523 ,插入汉字(65523-1)/2  个汉字。

显示汉字长度不正确原因

在插入汉字是如果汉字大于varchar(n) 中(N-1)/2 的值 ,N为 是奇数 。插入的值为:汉字个数+1空字符     汉字个数=(N-1)/2

 

结论 :  latin1 中varchar(N) N 最多能插入65523 个字母或数字,能插入N/2 个汉字