天堂等于天下?是的,你的眼睛没有花~,看下面例子
mysql> create table t (a varchar(12) default null,b varchar(12) default null, unique key idx_a (a),unique key idx_b (b)) engine=innodb default charset=latin1;
Query OK, 0 rows affected (0.00 sec)
mysql>
mysql> insert into t values ("天堂",1);
Query OK, 1 row affected (0.00 sec)
mysql>
mysql> insert into t values ("天下",1);
ERROR 1062 (23000): Duplicate entry '天下' for key 'idx_a'
mysql>
这是由于'天堂'和'天下'gbk编码在latin1_swedish_ci排序集下是相等的。
'天堂' --- CCECCCC3
'天下' --- CCECCFC2
'天下' --- CCECCFC2
线上的业务修改方法,建议如下:
mysql> alter table t change a a varchar(20) CHARACTER SET latin1 collate latin1_bin;
Query OK, 2 rows affected (0.00 sec)
Records: 2 Duplicates: 0 Warnings: 0
mysql>
mysql> insert into t values ("天下",2);
Query OK, 1 row affected (0.00 sec)
mysql>
当然了,同时也存在了ABC等于abc:
mysql> insert into t values ('ABC','ABC');
Query OK, 1 row affected (0.00 sec)
mysql>
mysql> insert into t values ('abc','ABC');
ERROR 1062 (23000): Duplicate entry 'abc' for key 'idx_a'
mysql>
下面是一段运维、产品和DBA的对话:
对于未上线的业务建议统一字符集,现在内存也便宜了,如果是移动端的,建议直接上utf8mb4,因为最近升级一个线上的字符集,蛋微微疼。