db.collection.createIndex({"id": 1, "platform": 1}, {unique:true})
db.collection.update_one(
{"id": id, "platform": platform)},
{'$set': {"some_key": data}}, upsert = True)
我已经创建了一个复合索引,并使用搜索条件将其设置为唯一,这样,在集合中,如果搜索到的内容,我搜索的内容将始终唯一。
但是在高并发的情况下,我们会有多个服务同时更新同一个collection,操作都是update_one + upsert=true 来完成的,但是每隔一段时间,服务就会报错,提示 E11000 duplicate key error collection。
这是为什么呢?
在源码中 upsert的解释是
upsert
(optional): IfTrue
, perform an insert if no documents
match the filter.
查询不到就插入,查询到了就更新,那会有什么问题呢? 怎么会唯一键冲突呢?
查询到官网的jira解释是:
在使用upsert=true选项进行更新期间,两个(或更多)线程可能会尝试使用相同的查询语句进行upsert操作,并且在没有找到匹配时,线程将尝试插入一个新的文档。两次插入都会(而且应该)成功,除非第二次插入导致违反唯一约束。
所以嘛,是再mongo库执行upsert的时候 并发插入导致的唯一键冲突。
官方原文链接
官方其实已经给出了解决方案,升级mongodb 到4.2 生产版本即可。
但是对于我们升级可能会有隐患的同学 就加个retry吧。