一、分片概述
首先,我们先来了解一下分片的含义。所有的数据库都可以进行手动分片,所以,分片并不是MongoDB所特有的,不同类型的数据均可以通过人为操作被分配到不同的数据库服务器上,然而,人工分片是需要编写相关代码来实现分片功能,并且还不容易维护。MongoDB数据库就可以实现自动分片,它内置了多种分片逻辑,使得MongoDB可以自动处理分片上数据的分布,也可以很容易地管理分片集群。
由于数量过大,导致本地磁盘不足以储存的情况;为了提高数据库性能,从而将海量数据存储在内存中,导致单个MongoDB数据库内存不足的情况;若是出现数据请求量太大,导致单MongoDB机器不能满足读写数据的性能情况。若是出现这三种情况,我们就可以使用MongoDB的分片技术来解决。
二、分片集群架构
在MongoDB分片集群中,只有各组件间的协同工作,才可使分片集群正常运行。在学习分片集群的操作之前,有必要先来学习一下分片集群架构。下面,通过一张图来介绍分片集群架构,如下图:
从图中可以看出,分片集群中主要由三个部分组成,即分片服务器( Shard )、路由服务器
( Mongos )以及配置服务器( Config Server )组成。其中,分片服务器有三个,即 Shard1 、
Shard2 、 Shard3 ;路由服务器有两个,即 Mongos1 和 Mongos2 ;配置服务器有三个,即主、副、副。
主要有如下所述三个主要组件:
Shard: 用于存储实际的数据块,实际生产环境中一个shard server 角色可由几台机器组个一个 replica set 承担,防止主机单点故障
Config Server: mongod实例,存储了整个 ClusterMetadata ,其中包括 chunk 信息。
Query Routers: 前端路由,客户端由此接入,且让整个集群看上去像单一数据库,前端应用可以透明使用。
三、部署分片集群
1、环境准备
分节 | 节点 | 端口 | 路经 |
1 | shard11(主) | 4006 | dbpath:D:\shard1\shard11\data logpath:D:\shard1\shard11\log |
shard12(从) | 4007 | dbpath:D:\shard1\shard12\data logpath:D:\shard1\shard12\log | |
2 | shard21(主) | 4008 | dbpath:D:\shard2\shard21\data logpath:D:\shard2\shard21\log |
shard(从) | 4009 | dbpath:D:\shard2\shard22\data logpath:D:\shard2\shard22\log |
每一个分片都应该安装 MongoDB 实例,需要将 bin 文件复制到每个分片中
每个shard包含两个示例
2、启动分片服务
进入bin目录中,打开cmd,实现效果如下图:
当命令一直保持运行状态则说明服务运行成功,此服务为一次性服务,不要关闭此窗口,最小化即可
再次进入数据库bin目录中,文件栏启动cmd,如下:
并且启动shard21和shard22:
注意:1.如果电脑版本比较高, cmd 需要以管理员身份运行
2.启动服务均为一次性服务,关闭 cmd 即为关闭服务,所以在未完成前,请勿关闭
3.实例均未添加至系统环境变量,请在 bin 目录下启动
3.、配置分片集群
进入到shard1集群任何一个节点中,如下:
进入shard2集群任何一个节点中,如下:
四、部署config server
1、环境准备
config实例 | 端口 | 数据路径 | 日志路径 |
config1(主) | 4002 | D:\config\config1\data | D:\config\config1\log |
config2(从) | 4003 | D:\config\config2\data | D:\config\config2\log |
每个文件夹添加data和log
2、启动config server
进入bin目录中,启动cmd
\bin>mongod --configsvr --replSet confset -port 4002 -dbpath D:\config\config1\data -logpath D:\config\config1\log\conf1.log
-configsvr 这里我们完全可以像启动普通 mongodb 服务一样启动,不需要添加 —shardsvr 和 configsvr 参数。因为这两个参数的作用就是改变启动端口的,所以我们自行指定了端口就可以
要注意的是,cmd窗口是不可以关闭的,老师在上课时经常提到
3、配置config server集群
进入任何一个配置服务器的节点初始化配置服务器的群集
use admin
config={_id:"confset",configsvr:true,members:[
... {_id:0,host:"localhost:4002"},
... {_id:1,host:"localhost:4003"}
... ]}
rs.initiate(config)
部署路由服务器
在进入 数据库 bin 目录中 启动 cmd
D:\MongoDB\bin>mongos --configdb confset/localhost:4002,localhost:4003 -logpath D:\mongos\log\mongos.log -port 4000
简单介绍一下mongos:mongos 就是一个路由服务器,它会根据管理员设置的 “ 片键 ” 将数据分摊到自己管理的mongod 集群,数据和片的对应关系以及相应的配置信息保存在 "config 服务器 " 上
五、配置分片信息
bin 目录下使用 MongoDB Shell 登录到 mongos ,添加 Shard 节点
六、测试分片
登入路由(4000) 端口
指定要分片的数据库
mongos> sh.enableSharding("test")
指定数据库里需要分片的集合和片键,片键根据实际情况选择
mongos> sh.shardCollection("test.c2",{"id":"hashed"})
上述指令指定分片集合为c2,分片字段为“id”,分片形式是哈希分片,若改成“1”则为范围分片
如果集合已经包含数据,则必须在分片集合之前创建一个支持分片键的索引,如果集合为空,则
mongodb 将创建索引
插入数据验证
mongos> for(var i=1;i<=10000;i++){
... db.c2.save({id:i,name:"a"+i});}
七、总结
MongoDB的分片技术是实现数据库水平扩展的重要手段之一。通过合理的分片部署和配置,我们可以构建出高性能、高可用的数据库集群,满足大规模数据存储和查询的需求。在实际应用中,我们需要根据具体的业务场景和数据模型来选择合适的分片策略和优化措施,以提高整个系统的性能和稳定性