MongoDB中自动增长ID详解(实现、应用及优化)

祁姝是个小欢喜

于 2024-08-20 04:22:27 发布

阅读量30

点赞数

文章标签： mongodb 数据库

引言

在MongoDB中，自动增长的功能主要通过使用数据库的ObjectId或自定义的序列来实现。ObjectId是MongoDB默认的主键类型，它是唯一的并且具有一定的排序特性。然而，在某些场景下，可能需要使用自定义的自动增长ID，例如在某些遗留系统中或者为了更好的用户体验。

基本语法和命令

使用ObjectId

ObjectId是MongoDB默认的主键类型，它由12字节组成，包括时间戳、机器标识符、进程ID和计数器。每次插入新文档时，MongoDB会自动生成一个新的ObjectId。

插入新文档时，_id字段会自动生成：

1	`db.collection.insertOne({name:` `"example"})`

自定义自动增长ID

如果需要自定义自动增长ID，可以使用以下方法：

创建计数器集合：
创建一个专门的集合来存储序列计数器。

1 2	`db.createCollection("counters")` `db.counters.insertOne({_id:` `"productid", seq: 0})`

定义获取下一个序列值的函数：
使用findAndModify原子操作来获取并增加序列值。

1 2 3 4 5 6 7 8	`function` `getNextSequence(name) {` `var` `ret = db.counters.findAndModify({` `query: { _id: name },` `update: { $inc: { seq: 1 } },` `new:` `true` `});` `return` `ret.seq;` `}`

插入新文档并使用自定义ID：
在插入新文档时，调用该函数以生成新的ID。

1 2 3 4	`db.products.insertOne({` `_id: getNextSequence("productid"),` `name:` `"example"` `})`

示例

以下是完整的示例代码：

创建计数器集合并插入初始值：

1	`db.counters.insertOne({_id:` `"userid", seq:` `0})`

定义获取下一个序列值的函数：

1 2 3 4 5 6 7 8	`function` `getNextSequence(name) {` `var` `ret = db.counters.findAndModify({` `query: { _id: name },` `update: { $inc: { seq: 1 } },` `new:` `true` `});` `return` `ret.seq;` `}`

插入新文档并使用自定义ID：

1 2 3 4	`db.users.insertOne({` `_id: getNextSequence("userid"),` `name:` `"John Doe"` `})`

应用场景

1. 遗留系统迁移

详解：
在许多企业中，遗留系统使用关系数据库（如MySQL、PostgreSQL等），并依赖于自增ID作为主键。如果计划将这些系统迁移到MongoDB中，直接使用MongoDB的ObjectId可能会导致兼容性问题或破坏现有业务逻辑。因此，自定义自动增长ID可以简化迁移过程，保留原有系统的ID生成机制。

示例场景：
假设一家电子商务公司决定将其产品数据库从MySQL迁移到MongoDB。原系统中的产品ID是自增的整数。

1 2 3 4 5 6 7 8 9	`// MySQL中的产品表` `CREATE` `TABLE` `products (` `id` `INT` `AUTO_INCREMENT` `PRIMARY` `KEY,` `name` `VARCHAR(255),` `price` `DECIMAL(10, 2)` `);` `// 原有数据` `INSERT` `INTO` `products (name, price)` `VALUES` `('Laptop', 999.99), ('Smartphone', 699.99);`

在迁移到MongoDB时，需要保留这些自增的ID。

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19	`// 在MongoDB中创建计数器集合` `db.counters.insertOne({_id:` `"productid", seq: 2})` `// 假设MySQL中已有两个产品` `// 定义获取下一个序列值的函数` `function` `getNextSequence(name) {` `var` `ret = db.counters.findAndModify({` `query: { _id: name },` `update: { $inc: { seq: 1 } },` `new:` `true` `});` `return` `ret.seq;` `}` `// 插入新产品时使用自定义ID` `db.products.insertOne({` `_id: getNextSequence("productid"),` `name:` `"Tablet",` `price: 499.99` `});`

2. 用户友好ID

详解：
对于前端用户，使用连续的、自增的数字ID比使用ObjectId更友好、更容易记忆。特别是在需要用户手动输入或引用ID的场景中，自增ID会更简洁、易读。

示例场景：
一个博客平台希望用户能够通过短链接直接访问文章。使用自增ID可以生成短链接，提升用户体验。

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23	`// 创建计数器集合` `db.counters.insertOne({_id:` `"postid", seq: 0})` `// 定义获取下一个序列值的函数` `function` `getNextSequence(name) {` `var` `ret = db.counters.findAndModify({` `query: { _id: name },` `update: { $inc: { seq: 1 } },` `new:` `true` `});` `return` `ret.seq;` `}` `// 插入新文章时使用自定义ID` `db.posts.insertOne({` `_id: getNextSequence("postid"),` `title:` `"How to Use MongoDB",` `content:` `"MongoDB is a NoSQL database..."` `});` `// 生成的短链接` `var` `postId = getNextSequence("postid");` `var` shortLink = `http://blogplatform.com/post/${postId}`; // http://blogplatform.com/post/1

3. 特定业务需求

详解：
某些业务逻辑需要使用连续的、自增的数字ID。例如，订单管理系统可能需要连续的订单号，以便于财务对账和客户查询。

示例场景：
一家在线零售商需要为每个订单生成连续的订单号，以便于物流跟踪和客户服务。

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27	`// 创建计数器集合` `db.counters.insertOne({_id:` `"orderid", seq: 1000})` `// 假设订单号从1001开始` `// 定义获取下一个序列值的函数` `function` `getNextSequence(name) {` `var` `ret = db.counters.findAndModify({` `query: { _id: name },` `update: { $inc: { seq: 1 } },` `new:` `true` `});` `return` `ret.seq;` `}` `// 插入新订单时使用自定义ID` `db.orders.insertOne({` `_id: getNextSequence("orderid"),` `customerName:` `"Alice",` `items: [` `{productId: 1, quantity: 2},` `{productId: 2, quantity: 1}` `],` `total: 1699.97` `});` `// 新生成的订单号` `var` `orderId = getNextSequence("orderid");` `console.log("New Order ID: "` `+ orderId);` `// New Order ID: 1001`

注意事项

1. 并发问题

详解：
在高并发环境中，多个请求同时访问计数器集合时，必须确保findAndModify操作是原子的，以避免生成重复ID。MongoDB的findAndModify操作是原子的，它可以保证在高并发环境下每次操作都是唯一的，从而避免重复ID的生成。

示例代码：

假设有一个计数器集合counters，我们使用以下代码来确保原子性：

1 2 3 4 5 6 7 8 9 10 11 12 13 14	`// 获取下一个自增ID的函数` `function` `getNextSequenceValue(sequenceName) {` `var` `sequenceDocument = db.counters.findAndModify({` `query: { _id: sequenceName },` `update: { $inc: { sequence_value: 1 } },` `new:` `true,` `upsert:` `true` `});` `return` `sequenceDocument.sequence_value;` `}` `// 使用示例` `var` `nextUserId = getNextSequenceValue('user_id');` `db.users.insert({ _id: nextUserId, name:` `"John Doe"` `});`

2. 性能影响

详解：
频繁更新计数器集合可能会成为性能瓶颈，尤其是在高并发环境中。每次获取新的ID都需要对计数器集合进行读写操作。这种频繁的读写操作可能会影响数据库的整体性能。为了解决这个问题，可以考虑使用分布式ID生成算法，如Twitter的Snowflake，它生成的ID不仅是唯一的，而且是分布式的，不需要频繁访问数据库。

示例代码：

使用JavaScript实现简单版的Snowflake算法：

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58	`class Snowflake {` `constructor(workerId, datacenterId, sequence = 0) {` `this.workerId = workerId;` `this.datacenterId = datacenterId;` `this.sequence = sequence;` `this.twepoch = 1288834974657n;` `this.workerIdBits = 5n;` `this.datacenterIdBits = 5n;` `this.maxWorkerId = -1n ^ (-1n <<` `this.workerIdBits);` `this.maxDatacenterId = -1n ^ (-1n <<` `this.datacenterIdBits);` `this.sequenceBits = 12n;` `this.workerIdShift =` `this.sequenceBits;` `this.datacenterIdShift =` `this.sequenceBits +` `this.workerIdBits;` `this.timestampLeftShift =` `this.sequenceBits +` `this.workerIdBits +` `this.datacenterIdBits;` `this.sequenceMask = -1n ^ (-1n <<` `this.sequenceBits);` `this.lastTimestamp = -1n;` `}` `tilNextMillis(lastTimestamp) {` `let timestamp =` `this.timeGen();` `while` `(timestamp <= lastTimestamp) {` `timestamp =` `this.timeGen();` `}` `return` `timestamp;` `}` `timeGen() {` `return` `BigInt(Date.now());` `}` `nextId() {` `let timestamp =` `this.timeGen();` `if` `(timestamp <` `this.lastTimestamp) {` `throw` `new` `Error('Clock moved backwards. Refusing to generate id');` `}` `if` `(this.lastTimestamp === timestamp) {` `this.sequence = (this.sequence + 1n) &` `this.sequenceMask;` `if` `(this.sequence === 0n) {` `timestamp =` `this.tilNextMillis(this.lastTimestamp);` `}` `}` `else` `{` `this.sequence = 0n;` `}` `this.lastTimestamp = timestamp;` `return` `((timestamp -` `this.twepoch) <<` `this.timestampLeftShift) \|` `(this.datacenterId <<` `this.datacenterIdShift) \|` `(this.workerId <<` `this.workerIdShift) \|` `this.sequence;` `}` `}` `// 使用示例` `const snowflake =` `new` `Snowflake(1n, 1n);` `const id = snowflake.nextId();` `console.log(id.toString());` `// 生成唯一ID`

3. 唯一性保证

详解：
在分布式环境中，确保ID的唯一性是一个挑战。即使在多个节点上生成ID，也必须保证每个ID是唯一的。通过使用分布式ID生成算法（如上所述的Snowflake），可以在多个节点上生成唯一的ID，而不需要依赖单一的数据库计数器。

示例代码：

继续使用上面的Snowflake示例，在多个服务节点上生成唯一ID：

1 2 3 4 5 6 7 8 9	`// 服务节点1` `const snowflake1 =` `new` `Snowflake(1n, 1n);` `const id1 = snowflake1.nextId();` `console.log(id1.toString());` `// 唯一ID` `// 服务节点2` `const snowflake2 =` `new` `Snowflake(2n, 1n);` `const id2 = snowflake2.nextId();` `console.log(id2.toString());` `// 唯一ID`

通过以上示例，在不同的服务节点上生成的ID仍然是唯一的，确保了分布式环境中的ID唯一性。

总结

在MongoDB中，ObjectId提供了一种简单且有效的唯一标识符生成方式，但在某些情况下，自定义的自动增长ID可能更适合。通过创建计数器集合和使用findAndModify操作，可以实现自定义的自动增长ID。需要注意的是，在实现自定义自动增长ID时，必须处理好并发和性能问题，以确保ID的唯一性和生成效率。

以上就是MongoDB中自动增长ID详解(实现、应用及优化)的详细内容，更多关于MongoDB自动增长ID的资料请关51CTO其它相关文章！

原创作者: u_14585161 转载于: https://blog.51cto.com/u_14585161/11783585

祁姝是个小欢喜

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MongoDB中自动增长ID详解(实现、应用及优化)

引言在MongoDB中，自动增长的功能主要通过使用数据库的ObjectId或自定义的序列来实现。ObjectId是MongoDB默认的主键类型，它是唯一的并且具有一定的排序特性。然而，在某些场景下，可能需要使用自定义的自动增长ID，例如在某些遗留系统中或者为了更好的用户体验。基本语法和命令使用ObjectIdObjectI...
复制链接

扫一扫