1 字符集和比较规则介绍
字符集: 字符的编码规则
比较规则:字符集中字符比较大小的规则,一般是对字符串列进行排序,也叫排序规则
两者关系:
一个字符集可以有许多比较规则,会有一个默认的比较规则;
而一个比较规则一定会对应一个字符集。
字符集和比较规则的使用说明:
1)字符集和比较规则有4个级别,分别为:服务器、数据库、表、字符串字段;
2)每个级别如果没有设置字符集或者比较规则,则会用上一级别的字符集和比较规则;
例如:在建表的时候如果没有指明字符集和比较规则, 会使用数据库的字符集和比较规则。
3)只修改字符集,则比较规则会跟着一起变; 只修改比较规则,字符集会跟着一起变;
查看数据库中字符集和比较规则的语句:
show variables like '%character_set_database%'; 查看数据库字符集
show variables like '%collation_database'; 查看数据库比较规则
2 客户端和服务器字符集的交互
服务器接收到客户端的请求数据后, 会经过3层编码转换,分别为:
character_set_client 服务器接收请求的编码
character_set_connection 服务器处理请求的编码
character_set_results 服务器返回结果给客户端的编码
服务器会经过3种编码的转换,过程如下:
当客户端的字符集和服务器的这3个字符集编码不同时, 会解析不了数据, 一般都要求客户端和服务器的编码相同。
服务端设置3种客户端编码的命令为:
SET NAMES 字符集名;
这个命令等价下面3个命令的组合:
set character_set_client = 字符集名;
set character_set_connection = 字符集名;
set character_set_results = 字符集名;
客户端设置服务端3种字符集的方法,可以在客户端启动的时候设置一个选项:
default-character-set=utf8 效果和把上面3个字符集一个一个设置是一样的