MongoDB

最新推荐文章于 2024-07-20 10:49:44 发布

LQQ一直都在改变

最新推荐文章于 2024-07-20 10:49:44 发布

阅读量937

点赞数 24

文章标签： mongodb 数据库

本文链接：https://blog.csdn.net/weixin_39878226/article/details/135698938

版权

一、简介

MongoDB是一个开源的非关系型数据库，它使用文档的方式存储数据。与传统的关系型数据库不同，MongoDB不需要使用和维护预定义的模式，数据以BSON（Binary JSON）格式的文档形式存储在集合（Collection）中。

MongoDB具有以下特点：

灵活的数据模型：MongoDB的数据模型非常灵活，每个文档可以有不同的结构，不需要事先定义表结构。这使得MongoDB适用于快速迭代和不断变化的数据需求。
高性能：MongoDB具有很高的读写性能和扩展能力。它采用了内存映射文件的方式管理内存，通过缓存数据和索引，实现快速查询和高吞吐量的数据访问。
强大的查询功能：MongoDB支持丰富的查询语法，包括范围查询、文本搜索、地理位置查询等。此外，MongoDB还提供了聚合管道（Aggregation Pipeline）功能，可以用于多个查询阶段的数据处理和转换。
高可用性和可伸缩性：MongoDB通过复制和分片来实现高可用性和可伸缩性。复制功能可将数据复制到多个节点，以提供数据的冗余和故障恢复功能。分片功能则将数据划分为多个分片，让数据分散存储在不同的服务器上，以支持海量数据存储和查询。
内建的数据分析功能：MongoDB内建了一些常用的数据分析功能，如聚合查询和地理位置查询。这些功能可以在数据库层面上进行数据处理和分析，简化了数据处理的流程。
可插拔的存储引擎：MongoDB支持多个存储引擎，如WiredTiger和MMAPv1等。这使得用户可以根据具体应用场景选择最适合的存储引擎，以满足特定的性能和数据一致性需求。

MongoDB被广泛应用于各种场景，包括Web应用、日志管理、物联网、实时分析等。它简化了数据存储和查询的过程，提供了灵活性和扩展性，并为开发者提供了丰富的工具和驱动程序来支持不同的编程语言和开发环境。

二、安装

1、在 CentOS 系统上安装并配置 MongoDB

步骤如下：

更新系统：首先，使用以下命令更新系统软件包：

sudo yum update -y

添加 MongoDB 的 YUM 源：MongoDB 提供了官方的 YUM 源，可以使用以下命令导入 GPG 公钥并创建 YUM 源文件：

sudo vi /etc/yum.repos.d/mongodb-org.repo

将以下内容复制粘贴到文件中：

[mongodb-org-4.4]
name=MongoDB Repository
baseurl=https://repo.mongodb.org/yum/redhat/$releasever/mongodb-org/4.4/x86_64/
gpgcheck=1
enabled=1
gpgkey=https://www.mongodb.org/static/pgp/server-4.4.asc

保存并关闭文件。

安装 MongoDB：运行以下命令安装 MongoDB：

sudo yum install -y mongodb-org

配置 MongoDB：默认情况下，MongoDB 使用 /var/lib/mongo 目录作为数据存储路径，使用 /var/log/mongodb/mongod.log 作为日志文件路径。你可以根据需要修改这些配置。
- 数据存储路径配置：编辑 /etc/mongod.conf 文件，找到 storage 部分，并修改 dbPath 属性为你所需的路径，例如：

storage:
  dbPath: /your/data/path

日志文件路径配置：编辑 /etc/mongod.conf 文件，找到 systemLog 部分，并修改 path 属性为你所需的路径，例如：

systemLog:
  destination: file
  path: /your/log/path/mongod.log

保存并关闭文件。

启动 MongoDB：运行以下命令启动 MongoDB 服务：

sudo systemctl start mongod

设置开机自启：运行以下命令设置 MongoDB 开机自启：

sudo systemctl enable mongod

至此，MongoDB 已经成功安装并配置在 CentOS 系统上。

2、检查 MongoDB 服务状态

你可以通过以下命令检查 MongoDB 服务状态：

sudo systemctl status mongod

通过以下命令停止 MongoDB 服务：

sudo systemctl stop mongod

通过以下命令重新启动 MongoDB 服务：

sudo systemctl restart mongod

请注意，安装过程可能会随着版本的更新而略有变化，请参考 MongoDB 官方文档了解最新的安装方法和注意事项。

三、数据模型

1、数据模型特点

MongoDB 是一种面向文档的数据库，数据模型是基于文档的概念。它不同于传统的关系型数据库，其中数据以表、行和列的形式进行组织。

在 MongoDB 中，数据以 BSON（Binary JSON）文档的形式存储。BSON 是一种二进制表示的 JSON 格式，用于表示多种数据类型。每个 BSON 文档都是一个键值对的集合，类似于关系型数据库中的一行数据，但它更灵活，没有固定的模式。

以下是 MongoDB 数据模型的要点：

文档：MongoDB 中的数据单元被称为文档。文档是一个具有动态结构的记录，使用 BSON 格式进行序列化。它类似于关系型数据库中的一行数据，但是没有固定的列数和列名。

集合：文档以集合的形式组织在 MongoDB 中。一个集合是一组相似文档的容器。与关系型数据库不同，MongoDB 不要求集合中的文档具有相同的结构，也不要求定义模式。

字段：文档中的键值对被称为字段。字段由一个唯一的键和对应的值组成。每个文档可以具有不同的字段，每个字段的值可以是不同的数据类型。

嵌入文档：MongoDB 支持嵌套或嵌入式文档。这意味着在一个文档中可以包含其他文档作为其字段的值。嵌入式文档使得在一个查询中可以获取相关文档的信息，从而减少多个关系型表之间的 JOIN 操作。

引用文档：MongoDB 还支持引用或关联其他文档。通过在一个文档中存储对其他文档的引用，可以在不同集合之间建立关系。引用文档使得可以在不同集合之间进行 JOIN 操作。

总的来说，MongoDB 的数据模型具有灵活性和扩展性，允许开发者根据应用程序的需要设计和组织数据。这种灵活性使得 MongoDB 非常适合存储半结构化数据和需要频繁修改的数据。

2、文档的特点和使用方式

MongoDB 的数据模型是基于文档的数据库模型。在 MongoDB 中，文档是一种有序的键值对集合，使用 BSON (Binary JSON) 格式进行存储和表示。

以下是文档的特点和使用方式：

结构灵活：文档中的键值对没有固定的结构，每个文档可以有不同的字段和字段值类型。这使得 MongoDB 非常适合存储半结构化数据，因为它不需要遵循预定义的模式。

嵌入式文档：文档中的值可以是其他文档，实现了嵌套或嵌入式文档的功能。嵌入式文档使得数据的组织更加紧凑，并且可以在单个查询中检索相关文档的信息，而无需进行 JOIN 操作。

动态模式：由于文档不需要遵循固定的模式，因此可以自由地在同一集合中存储具有不同字段和结构的文档。这使得可以在开发过程中动态地调整数据模型，而无需对数据库进行重构。

层次化数据结构：文档可以使用数组、嵌套文档和其他复杂数据类型来表示层次化的数据结构。这使得 MongoDB 能够处理复杂的数据关系，如多对多的关系。

基于键值查询：可以通过文档中的键值对进行灵活的查询。MongoDB 提供了丰富的查询语言和操作符，允许使用具体的字段值或查询条件进行查询。

容易扩展：通过在分布式环境中复制和分片数据，可以实现 MongoDB 的横向扩展。文档模型使得数据分片和负载均衡变得更加容易。

使用文档模型，开发人员可以根据应用程序的需要自由设计和组织数据。且文档的灵活性和性能使得 MongoDB 成为处理复杂数据和大规模数据存储的有效工具。

四、查询语言

1、常用查询语言和操作符

MongoDB 的查询语言是基于 JSON 的，支持丰富的查询操作和操作符。以下是 MongoDB 的常用查询语言和操作符：

等于匹配：使用 { field: value } 进行查询，表示匹配字段等于给定值的文档。

比较操作符：例如 $gt、$lt、$gte、$lte、$ne 等，用于进行大于、小于、大于等于、小于等于、不等于等比较查询。

逻辑操作符：例如 $and、$or、$not、$nor 等，用于进行逻辑与、逻辑或、逻辑非、逻辑或非等查询。

字符串模式匹配：使用 $regex 操作符进行正则表达式的模式匹配查询。

数组操作符：例如 $in、$nin、$all 等，用于在数组字段中进行查询，包括匹配数组中的一项、不匹配数组中的一项、匹配数组中的多项等。

字段存在性：使用 $exists 操作符查询某个字段是否存在。

数字运算：例如 $inc、$mul、$min、$max 等，用于对数字字段进行增加、乘法、取最小或取最大操作。

数组操作：例如 $push、$addToSet、$pop、$pull 等，用于对数组字段进行增加元素、添加去重元素、删除末尾元素、删除指定元素等操作。

聚合操作：使用聚合管道（aggregation pipeline）进行复杂的数据聚合、分组、筛选和转换操作。

分页和排序：使用 $skip、$limit、$sort 进行分页和排序操作。

这些仅是 MongoDB 查询语言的一部分，MongoDB 还提供了很多其他操作符和功能，如地理空间查询、文本搜索、索引等。开发人员可以根据具体的查询需求选择合适的操作符和方式来构建查询。

2、MongoDB 查询语言的案例

以下是一些使用 MongoDB 查询语言的案例：

查询所有文档：
```
db.collection.find({})
```

查询指定字段的文档：

db.collection.find({}, { field1: 1, field2: 1 })

等于匹配查询：
```
db.collection.find({ field: value })
```

比较操作符查询：

db.collection.find({ field: { $gt: value } })

逻辑操作符查询：

db.collection.find({ $or: [{ field1: value1 }, { field2: value2 }] })

正则表达式模式匹配查询：

db.collection.find({ field: { $regex: "pattern" } })

数组操作符查询：

db.collection.find({ field: { $in: ["value1", "value2"] } })

字段存在性查询：

db.collection.find({ field: { $exists: true } })

数字运算更新：

db.collection.updateMany({}, { $inc: { field: 1 } })

数组操作更新：

db.collection.updateOne({ _id: ObjectId("documentId") }, { $push: { arrayField: "value" } })

以上只是一些常见的案例，实际使用 MongoDB 查询语言可以根据具体的数据结构和查询需求进行灵活应用。MongoDB 提供了丰富的查询操作和操作符，开发人员可以根据具体的需求进行组合使用，以实现灵活的数据查询和更新操作。

五、索引优化

1、索引结构

MongoDB使用的是B树（B-tree）索引结构，它是一种在磁盘上存储和组织数据的数据结构。B树索引允许高效地进行快速的数据查找和范围查询，适用于面向磁盘的存储系统。

B树索引具有以下特点：

平衡性：B树是一种平衡的搜索树，它保持所有叶子节点到根节点的路径长度相近，确保查询操作的稳定性能。

多路复用：B树索引具有多路复用的特点，每个节点可以存储多个键值对。这使得每个节点的大小可以适应磁盘块的大小，减少了磁盘的读取次数。

分层结构：B树采用分层结构，根节点是最上层，叶子节点是最下层，中间层的节点用于快速定位查询目标。这种结构使得B树可以高效地支持范围查询。

顺序访问性：由于B树索引的节点按照键的顺序进行存储，所以在进行范围查询时可以按照顺序访问磁盘块，提高查询性能。

在MongoDB中，每个集合都可以有多个索引。创建索引可以通过调用createIndex()方法来实现。MongoDB支持普通索引、唯一索引、稀疏索引、全文本索引等不同类型的索引。通过合理地选择和创建索引，可以显著提高查询性能和数据访问效率。

2、索引分类

在 MongoDB 中，有多种类型的索引可供选择，每种索引可以解决不同的查询需求和优化性能。以下是一些常用的 MongoDB 索引类型：

单键索引（-Field Index）：对集合中的单个字段创建的索引，可以加快按照该字段的查询速度。

复合索引（Compound Index）：由多个字段组成的索引，可以提高复合查询的性能。复合索引使用多个字段的值按顺序来排序数据，支持多个字段的筛选操作。

多键索引（Multikey Index）：用于索引数组字段的所有元素，允许 MongoDB 在查询中检索数组字段中的所有值。

文本索引（Text Index）：用于对文本字段进行全文本搜索，在文本字段上执行相关查询和文本搜索。

球面地理空间索引（2dsphere Index）：用于对球面地理坐标数据（经度和纬度）进行查询，支持包括邻近搜索、多边形搜索等各种地理空间查询。

散列索引（Hashed Index）：将字段的值散列后进行索引，适用于一些需要快速哈希查找的场景。

TTL 索引（Time-To-Live Index）：用于自动删除指定时间范围内的文档，常用于存储定时任务、日志等需要定期清理的数据。

除了上述常见的索引类型，MongoDB 还支持一些特殊的索引和选项，如地理空间索引、部分索引等。选择合适的索引类型和创建适当的索引是优化 MongoDB 查询性能的重要一环，需要根据应用需求和查询模式进行合理的索引设计。

3、索引优化

在 MongoDB 中，索引是一种优化数据库查询性能的重要工具。以下是一些 MongoDB 索引优化的建议和技巧：

选择合适的索引字段：根据查询频率和查询条件选择合适的字段创建索引。常见的选择包括经常用于筛选和排序的字段，如唯一标识字段、外键字段、经常用于等值匹配的字段等。

创建复合索引：如果经常需要同时筛选多个字段，可以创建复合索引。复合索引是由多个字段组成的索引，可以减少多字段查询时的查询时间。

考虑索引排序顺序：在创建复合索引时，考虑字段的排序顺序。如果查询经常以某个字段进行排序，可以将该字段放在索引的前面。

避免创建过多索引：创建过多的索引会增加写操作的负担，并占用额外的存储空间。只创建真正需要的索引，避免冗余和重复的索引。

使用覆盖索引：覆盖索引是指查询结果可以完全通过索引获取，而无需读取文档。通过创建适当的复合索引，可以减少查询时需要读取的文档的数量，提高查询性能。

定期重建索引：长时间的数据更新和删除操作会导致索引不均衡和碎片化，可以定期重建索引来优化索引性能。

监控索引性能：使用 MongoDB 的性能监控工具如 explain() 方法或数据库的性能分析工具，可以分析查询的执行计划和索引使用情况，从而优化索引的性能。

使用 TTL 索引：如果需要自动删除过期数据，可以使用 TTL（Time-To-Live）索引。TTL 索引会在特定时间后自动删除过期的文档，无需手动删除。

考虑内存限制：索引数据通常存储在内存中，因此，在设计索引时要考虑 MongoDB 服务器的可用内存限制，避免创建过多过大的索引导致内存不足。

这些是一些常见的 MongoDB 索引优化技巧，具体的优化策略还需要根据应用需求和数据访问模式进行细化。在实际应用中，可以采用不同手段如索引优化、查询重写、数据分片等综合手段来提升 MongoDB 的查询性能。

六、数据复制与故障恢复

在MongoDB中，数据复制和故障恢复是通过复制集（Replica Set）来实现的。复制集由多个MongoDB实例组成，其中一个是主节点（Primary），其余的是从节点（Secondary）。主节点负责处理所有的写操作和部分读操作，从节点复制主节点的数据并处理读操作。

以下是MongoDB数据复制与故障恢复的一般步骤：

设置复制集成员：在MongoDB配置文件中，启动每个MongoDB实例时设置不同的端口和数据目录，然后为每个实例设置一个唯一的名称。通过编辑MongoDB配置文件或使用启动命令行参数来完成。

启动MongoDB实例：依次启动复制集中的每个MongoDB实例。从节点通过复制主节点的数据建立起来。
初始化复制集：连接主节点的MongoDB实例，使用rs.initiate()命令初始化复制集。例如，执行以下命令在主节点上初始化：
rs.initiate()
MongoDB将选举主节点并开始复制数据到从节点。
添加从节点：连接到主节点，使用rs.add()命令将其他MongoDB实例添加为从节点。例如，执行以下命令添加从节点：
rs.add({ host: "secondary.example.com:27017" })
您可以根据实际情况添加更多的从节点。
验证复制集状态：在主节点上执行rs.status()命令来验证复制集的状态。例如，执行以下命令查看复制集状态：
rs.status()
您应该能够看到主节点和从节点的信息以及它们的状态。

在进行故障恢复时，如果主节点发生故障，复制集会自动进行选举，选择一个新的主节点。一旦主节点恢复，它将重新加入复制集并成为从节点。

请注意，以上步骤是一个简单的示例，实际部署和故障恢复可能涉及更多的操作和配置，例如设置高可用性、读写关注等。建议参考MongoDB官方文档和教程以获取更详细的信息和指导。

特别说明：读写关注

在MongoDB中，读写关注（Read Concern 和 Write Concern）是用于控制读取和写入操作的一致性级别和确认级别的选项。它们可以帮助您确保数据的一致性和可靠性。

读关注（Read Concern）指的是在读取操作中所应用一致性级别。MongoDB提供了以下几种读关注级别：

“local”：默认级别，表示读取操作将返回本地副本集中的数据。这是一种较低的一致性级别。
“available”：表示读取操作将返回可用的数据。这是一种较高的一致性级别。
“majority”：表示读取操作将返回大多数副本集中的数据。这是一种更高的一致性级别。

写关注（Write Concern）指的是在写入操作中所应用的确认级别。MongoDB提供了以下几种写关注级别：

“acknowledged”：默认级别，表示写入操作在主节点完成后才会返回。这是一种较低的确认级别。
“w”：表示写入操作需要等待指定数量的副本节点应答确认。可以设置为具体数字或者特殊值 “majority”，表示大多数副本节点应答确认。
“unacknowledged”：表示写入操作在主节点收到数据后立即返回，而不等待其他节点的确认。这是一种较低的确认级别。
“journaled”：表示写入操作在主节点写入磁盘日志后返回。这是一种较高的确认级别。

读写关注级别的选择需要根据您的应用需求和对数据一致性的要求来决定。较低的级别可能会提高读写操作的性能，但可能导致一定程度的数据不一致。较高的级别能够提供更高的数据一致性，但可能降低性能。

您可以在使用MongoDB的客户端驱动程序中设置读写关注级别。具体的设置方式和可用选项可能因客户端驱动程序的不同而有所差异，请参考对应驱动程序的文档以了解更详细的信息。

需要注意的是，读写关注并不是解决所有一致性问题的唯一手段，还需要综合考虑其他因素，如复制集的配置、网络延迟等。如果对于数据的一致性有更高要求，可以考虑使用事务（在MongoDB 4.0及以上版本中可用）来确保操作的原子性和一致性。

七、性能调优

调优MongoDB的性能可以通过多个方面的优化来实现，以下是几个常见的性能调优建议：

索引优化：根据查询需求创建合适的索引可以显著提高查询性能。分析查询语句和查询计划，确定需要创建的索引类型（单字段、多字段、文本、地理等），并使用explain()命令检查索引的使用情况。

内存设置：增加MongoDB实例可用的内存大小，可以提高性能。确保操作系统不会过度交换（swap），设置数据库缓存（WiredTiger存储引擎的cache size）以避免频繁的磁盘读写操作。

查询优化：避免频繁地进行大量记录的全集合扫描，使用投影（projection）来减少返回的字段数量、limit()来限制返回结果的数量，以及skip()来跳过部分结果。

分片集群：对大规模数据集和高并发负载的情况下，可以考虑使用分片集群来横向扩展MongoDB。将数据分布在多个分片上可以提高读写性能和容量。

避免频繁的更新和删除操作：MongoDB在执行更新和删除操作时可能需要写入大量的日志和重写数据，这可能影响性能。尽量避免频繁地更新和删除操作，可以考虑使用增量更新或其他优化策略。

配置文件调优：调整MongoDB的配置文件中的参数，如最大连接数、线程池大小、日志级别等，可以根据实际情况优化性能。

监控和性能分析：定监控MongoDB的运行状态、性能指标和查询性能，使用工具如MongoDB自带mongostat和mongotop，以及第三方监控工具，可以帮助您发现瓶颈和优化机会。

需要根据具体情况选择适合的性能调优策略，并进行实验和测试来评估其效果。另外，了解MongoDB的工作原理和最佳实践，参考官方文档和社区资源可以对性能优化有更深入的了解。

八、安全性

MongoDB提供了多种安全性特性来保护数据和系统的安全性，以下是一些常见的MongoDB安全性措施：

访问控制：MongoDB通过访问控制功能来限制对数据库的访问。管理员可以创建用户，并赋予不同角色和权限，以限制用户对数据库、集合和文档的操作。可以使用用户名和密码进行身份验证，也可以使用X.509证书和Kerberos等其他身份验证方式。

数据传输加密：MongoDB可以使用TLS/SSL（传输层安全协议）来加密数据在网络传输过程中的安全性。通过启用TLS/SSL，可以保护连接以及数据在客户端和MongoDB服务器之间的传输过程中的机密性和完整性。

安全审计：MongoDB可以记录和审计数据库操作，如读取、写入、更新和删除等操作。审计日志可以存储在磁盘上，并提供审计记录的保留和查询功能，以满足合规性和安全性要求。

参数配置安全性：通过适当的参数配置，可以增强MongoDB的安全性。例如，禁用不安全的操作（如eval()函数）、设置适当的密码策略（如密码复杂度要求、密码过期时间）、禁用远程管理接口（如mongodump和mongorestore）等。

防火墙和网络隔离：通过配置网络和防火墙规则，限制MongoDB服务的访问仅限于信任的主机。此外，可以使用虚拟专用网络（VPC）或其他网络隔离技术将MongoDB置于安全的网络环境中。

数据备份与恢复：定期进行数据备份，并将备份数据存储在安全的位置，以防止数据丢失或损坏。备份数据可以用于恢复数据，以提供业务连续性和数据保护。

除了上述安全性措施，对于MongoDB的安全性还有其他一些最佳实践，如定期更新MongoDB的版本、限制权限最小化原则、监控系统以检测异常操作等。

需要根据具体情况和安全要求来选择和实施安全性措施，并定期评估和更新安全性策略，以确保MongoDB系统和数据的安全性。