近日写码,遇到奇怪问题。在MySQL查询“180ML”,查到了"180ml",代码未做判断,导致用Set<String>做difference发现不存在,重新插入时,发生DuplicateKey。
经试验,默认varchar是大小写不敏感的,是因为MySQL默认使用_ci校对规则。(table使用的utf8mb4,为了支持特殊字符。通过执行show collation,可以看到表的默认校对规则为utf8mb4_general_ci。)
解决方案1:指定字段为BINARY(字节),就可以使其对大小写敏感。
ALTER TABLE sometable MODIFY name varchar(64) BINARY;
解决方案2:指定字段的校对规则,如使用_cs规则,或者_bin规则。
ALTER TABLE sometable MODIFY name varchar(64) COLLATE utf8mb4_bin;
此时也即强行指定name列的字符集为utf8mb4。
或
ALTER TABLE sometable MODIFY name varchar(64) COLLATE utf8_bin;
注意:使用utf8_bin校对规则时,name的字符集会自动变为utf8。
解决方案3:指定表的校对规则。
ALTER TABLE sometable DEFAULT COLLATE utf8mb4_bin
或
ALTER TABLE sometable COLLATE utf8mb4_bin
指定默认校对规则为_bin。此时如果该表已经设置过其他校对规则,所有的varchar列将仍保持原校对规则,新规则无法生效。
详见
https://www.2cto.com/database/201309/245268.html