在Mysql Server端有很多关于字符编码的配置参数,比如
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
可以通过"SHOW VARIABLES LIKE 'character%';"命令查看。
从Mysql Client得到的字符流到达具体表的过程中,需要经过多个转换环节,在这些环节中会用到以上的一些字符编码的配置参数值进行编码和解码,具体细节需要查看相应文档。 可以肯定的是最后有个转换环节,以字段的编码配置(如果未显式配置,默认的值为表的编码配置)为转换环节中的编码方案。
查看表和字段的编码配置的命令如下: "SHOW CREATE TABLE table_name"
从建表语句中,可以获知表的编码配置和字段的编码配置。
如果现在的字符流为A,那么经过这个转换环节的过程可描述如下:
使用字段的编码配置,编码A字符流,得到Table_A字节流
下面举几个例子进行说明,可以承接
《JDBC URL中关于字符编码的配置参数》这篇文章。然后我们这里选择插入数据的场景。
1、
SQL:INSERT INTO `Footer`(`Value`) VALUES('好');
Mysql Server端接收到的字符:'好'
Value字段的编码配置:utf8
最后环节的转换过程:
Mysql Server使用utf8编码方案,编码'好'字符,得到‘e5 a5 bd’字节流
结果截图:
2、SQL:INSERT INTO `Footer`(`Value`) VALUES('好');
Mysql Server端接收到的字符:'好'
Value字段的编码配置:gbk
最后环节的转换过程:
Mysql Server使用gbk编码方案,编码'好'字符,得到‘ba c3’字节流
结果截图:
3、SQL:INSERT INTO `Footer`(`Value`) VALUES('�');
Mysql Server端接收到的字符:'�'
Value字段的编码配置:utf8
最后环节的转换过程:
Mysql Server使用utf8编码方案,编码'�'字符,得到‘ef bf bd’字节流
结果截图:
4、SQL:INSERT INTO `Footer`(`Value`) VALUES('�');
Mysql Server端接收到的字符:'�'
Value字段的编码配置:gbk
最后环节的转换过程:
Mysql Server使用gbk编码方案,编码'�'字符,不能编码,抛出异常,内容如下:
ERROR 1366 (HY000): Incorrect string value: '\xEF\xBF\xBD' for column 'Value' at row 1
备注:
要使得出现以上结果,必须设置Mysql的SQL_MODE为"TRADITIONAL",否则,默认情况下,SQL_MODE不为"TRADITIONAL",那么执行以上SQL语句,不会得到ERROR,而只会得到WARNING,内容如下:
1 row(s) affected, 1 warning(s): 1366 Incorrect string value: '\xEF\xBF\xBD' for column 'Value' at row 1
Mysql Server会将'�'字符以‘?’替换,从而编码得到‘3f’字节流
结果截图: