遇到一个很奇怪的问题,在数据库中搜索字符串“123”会将“123”以及“123_”【注:_表示空格】的数据都搜索出来,真是令人头大。
1、背景
品牌名校验,对新增的品牌名进行长度校验,历史数据不进行校验
select * from brand where brandName in (……);
某个品牌名是历史数据,如"123456789_",【下划线表示是一个空格】但是前端传值时,将品牌名的尾部空格进行了去除,为"123456789",执行SQL语句时,MySQL会将搜索出"123456789_"的品牌名,但是进行比对的时候,就没有品牌名和"123456789"相同,所以认为该品牌名是新增数据,需要进行长度校验,校验长度为8,不通过,报错。
2、场景复现
2.1 数据准备
新建表格
CREATE TABLE `t` ( `id` int(11) NOT NULL, `keyValue` varchar(255) NOT NULL, `extValue` varchar(255) NOT NULL DEFAULT '', PRIMARY KEY (`id`), KEY `ix_value` (`keyValue`)) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
插入数据
CREATE DEFINER=`root`@`localhost` PROCEDURE `idata`()begin declare i int; set i=1; while(i<=1000000)do insert into t(id,keyvalue) values(i,i); set i=i+1; end while;end
修改数据
update t set keyValue='109089 ' where id=109089;
2.2 场景复现
3、查阅资料
官方手册说明(5.0版本):
11.1.6.1. The CHAR and VARCHAR Types
All MySQL collations are of type PADSPACE. This means that all CHAR, VARCHAR, and TEXT values in MySQL are compared without regard to any trailing spaces. "Comparison" in this context does not include the pattern-matching operator, for which trailing spaces are significant.
所有MySQL归类均为PADSPACE类型。 这意味着将比较MySQL中的所有CHAR,VARCHAR和TEXT值,而不考虑任何尾随空格。 在本文中,"比较"不包括LIKE模式匹配运算符,对于后者,尾随空格很重要。
4.解决方案
4.1 技术解决方案
4.1.1 like
4.1.2 BINARY
4.1.3 length()函数
4.2 业务解决方案
上述的解决方案只能解决单条数据查询的场景,对于select in类型的查询还是没有找到比较好的解决方案,因此提出几点建议:
- 对于数据定义的问题:定义结尾带空格与不带空格的数据等价;即查询品牌名是否存在时,将品牌名尾部带空格和不带空格的品牌名视作同一品牌名,如“abc_”与“abc”视作同一品牌名;
- 对于数据的录入,去除尾部空格;
- 对于数据比对:如批量比对数据是否存在,将取出的结果集数据取出尾部空格,同时将待比对的数据去除尾部空格进行比对。