MySQL 表中已经添加了唯一索引,按理说有重复数据就会被拦截,为什么还会产生重复数据呢?
问题现象
一个业务表,为了保证数据唯一,给3 个字段 外部单号、场景类型及场景名称 添加了唯一索引;但是经过一段时间后,表中出现了重复的数据。
问题排查
比较两条数据,发现完全是一样的。
难道是索引加的不对?确认后发现索引无误。
UNIQUE KEY `uk_out_record_scene_type_name` (`out_record_id`,`scene_type`,`scene_name`)
唯一索引设置没问题,但是有相同的数据,这两数据有什么特殊之处吗?
莫非问题出在为 null 的字段上,顺着这个思路,翻阅相关资料,以下是 mysql 官网文档。
Unique Indexes
A UNIQUE
index creates a constraint such that all values in the index must be distinct. An error occurs if you try to add a new row with a key value that matches an existing row. If you specify a prefix value for a column in a UNIQUE
index, the column values must be unique within the prefix length. A UNIQUE
index permits multiple NULL
values for columns that can contain NULL
.
https://dev.mysql.com/doc/refman/5.7/en/create-index.html#create-index-unique
官方文档明确提到,null 值是允许存在多行记录的。
至此,问题已经明确。
问题解决
问题明确后,处理起来就很容易了。既然唯一索引 null 值允许存在多行记录,
那我们可以在数据库层面将字段设置为非空,或者是业务层加分布式锁进行拦截。
题外话
那么null 值,到底应不应该算作唯一呢?
其实在很早以前,有网友就给官方提过 bug,官方认为这不是一个 bug。
就这个问题,大家的观点也是一分为二,
有人认为这就是一个 bug,null 值也应该受到唯一索引的约束;
有人支持这不是 bug,理由是 null 表示的是未知数据,不是具体的值,null != null 返回的还是 null,足以说明两个 null 值不具有唯一性。
还有其他非常有意思的评论,有兴趣的可以自行去观摩,链接如下。
https://bugs.mysql.com/bug.php?id=8173