MongoDB 分片

分片

在Mongodb里面存在另一种集群,就是分片技术,可以满足MongoDB数据量大量增长的需求。

当MongoDB存储海量的数据时,一台机器可能不足以存储数据,也可能不足以提供可接受的读写吞吐量。这时,我们就可以通过在多台机器上分割数据,使得数据库系统能存储和处理更多的数据。


为什么使用分片

  • 复制所有的写入操作到主节点
  • 延迟的敏感数据会在主节点查询
  • 单个副本集限制在12个节点
  • 当请求量巨大时会出现内存不足。
  • 本地磁盘不足
  • 垂直扩展价格昂贵

MongoDB分片

下图展示了在MongoDB中使用分片集群结构分布:

上图中主要有如下所述三个主要组件:

  • Shard:

    用于存储实际的数据块,实际生产环境中一个shard server角色可由几台机器组个一个replica set承担,防止主机单点故障

  • Config Server:

    mongod实例,存储了整个 ClusterMetadata,其中包括 chunk信息。

  • Query Routers:

    前端路由,客户端由此接入,且让整个集群看上去像单一数据库,前端应用可以透明使用。


分片实例

分片结构端口分布如下:

Shard Server 127020
Shard Server 227021
Shard Server 327022
Shard Server 427023
Config Server :27100
Route Process:40000

步骤一:启动Shard Server

root@localhost:/# mkdir -p /www/mongoDB/shard/s0
root@localhost:/# mkdir -p /www/mongoDB/shard/s1
root@localhost:/# mkdir -p /www/mongoDB/shard/s2
root@localhost:/# mkdir -p /www/mongoDB/shard/s3
root@localhost:/# mkdir -p /www/mongoDB/shard/log

-

root@localhost:/# mongod -port 27020 -dbpath "/www/mongoDB/shard/s0/" -logpath "/www/mongoDB/shard/log/s0.log" -logappend -fork
about to fork child process, waiting until server is ready for connections.
forked process: 2797
child process started successfully, parent exiting
root@localhost:/# mongod -port 27021 -dbpath "/www/mongoDB/shard/s1/" -logpath "/www/mongoDB/shard/log/s1.log" -logappend -fork
about to fork child process, waiting until server is ready for connections.
forked process: 2818
child process started successfully, parent exiting
root@localhost:/# mongod -port 27022 -dbpath "/www/mongoDB/shard/s2/" -logpath "/www/mongoDB/shard/log/s2.log" -logappend -fork
about to fork child process, waiting until server is ready for connections.
forked process: 2839
child process started successfully, parent exiting
root@localhost:/# mongod -port 27023 -dbpath "/www/mongoDB/shard/s3/" -logpath "/www/mongoDB/shard/log/s3.log" -logappend -fork
about to fork child process, waiting until server is ready for connections.
forked process: 2861
child process started successfully, parent exiting

步骤二: 启动Config Server

root@localhost:/# mkdir -p /www/mongoDB/shard/config
root@localhost:/# mongod -port 27100 -dbpath "/www/mongoDB/shard/config/" -logpath "/www/mongoDB/shard/log/config.log" -logappend -fork
about to fork child process, waiting until server is ready for connections.
forked process: 2885
child process started successfully, parent exiting

注意:这里我们完全可以像启动普通mongodb服务一样启动,不需要添加—shardsvr和configsvr参数。因为这两个参数的作用就是改变启动端口的,所以我们自行指定了端口就可以。

步骤三: 启动Route Process

root@localhost:/# mongos -port 40000 -configdb 127.0.0.1:27100 -fork -logpath "www/mongoDB/shard/log/route.log" -chunkSize 500
2017-06-01T07:41:53.624-0700 W SHARDING [main] Running a sharded cluster with fewer than 3 config servers should only be done for testing purposes and is not recommended for production.
about to fork child process, waiting until server is ready for connections.
forked process: 2928
child process started successfully, parent exiting

mongos启动参数中,chunkSize这一项是用来指定chunk的大小的,单位是MB,默认大小为200MB.

步骤四: 配置Sharding

接下来,我们使用MongoDB Shell登录到mongos,添加Shard节点

root@localhost:/# mongo admin -port 40000 #此操作需要连接admin库
MongoDB shell version: 3.2.13
connecting to: 127.0.0.1:40000/admin
mongos> db.runCommand({addshard:"localhost:27020"})
{ "shardAdded" : "shard0000", "ok" : 1 }
mongos> db.runCommand({addshard:"localhost:27021"})
{ "shardAdded" : "shard0001", "ok" : 1 }
mongos> db.runCommand({addshard:"localhost:27022"})
{ "shardAdded" : "shard0002", "ok" : 1 }
mongos> db.runCommand({addshard:"localhost:27023"})
{ "shardAdded" : "shard0003", "ok" : 1 }
#设置分片存储的数据库:开启数据库分片功能,命令很简单 enablesharding(),这里开启test数据库
mongos> db.runCommand({enablesharding:"test"})
{ "ok" : 1 }
#指定集合中分片的片键,这里指定为id,time字段。
mongos> db.runCommand({shardcollection:"test.log",key:{id:1,time:1}})
{ "collectionsharded" : "test.log", "ok" : 1 }

步骤五: 程序代码内无需太大更改,直接按照连接普通的mongo数据库那样,将数据库连接接入接口40000

root@localhost:~# mongo -port 40000
MongoDB shell version: 3.2.13
connecting to: 127.0.0.1:40000/test

步骤六: 至此分片操作全部结束,接下来我们通过mongos向mongodb插入10w记录,然后通过printShardingStatus命令查看mongodb的数据分片情况。

mongos> for(i = 0;i < 100000;i++){db.test.insert({"time":"time_" + i,"age" : i,"name":"lime_" + i})}
WriteResult({ "nInserted" : 1 })

返回结果:???(源自贴吧不知道怎么验证,再重头配置太麻烦:应该是在启动 config 服务器那一步出了问题,我在启动config服务器时漏了 --configsvr ,加上就好了)

mongos> db.printShardingStatus()
2017-06-01T08:01:26.838-0700 E QUERY    [thread1] Error: error: {
    "ok" : 0,
    "errmsg" : "Surprised to discover that 127.0.0.1:27100 does not believe it is a config server",
    "code" : 72
} :
_getErrorWithCode@src/mongo/shell/utils.js:25:13
DBCommandCursor@src/mongo/shell/query.js:689:1
DBQuery.prototype._exec@src/mongo/shell/query.js:118:28
DBQuery.prototype.hasNext@src/mongo/shell/query.js:276:5
DBCollection.prototype.findOne@src/mongo/shell/collection.js:289:10
printShardingStatus@src/mongo/shell/utils_sh.js:544:19
DB.prototype.printShardingStatus@src/mongo/shell/db.js:1135:9
@(shell):1:1

预期结果:

这里主要看三点信息:

    ① shards:我们清楚的看到已经别分为两个片了,shard0000和shard0001。

    ② databases:这里有个partitioned字段表示是否分区,这里清楚的看到test已经分区。

    ③ chunks:这个很有意思,我们发现集合被砍成四段:无穷小 —— jack0,jack0 ——jack234813,jack234813——jack9999,jack9999——无穷大。分区情况为:3:1,从后面的 on shardXXXX也能看得出。

啦啦啦

-- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 

8天学通MongoDB——第六天 分片技术

下面我对这张图解释一下:

  人脸:代表客户端,客户端肯定说,你数据库分片不分片跟我没关系,我叫你干啥就干啥,没什么好商量的。

  mongos:首先我们要了解”片键“的概念,也就是说拆分集合的依据是什么?按照什么键值进行拆分集合....好了,mongos就是一个路由服务器,它会根据管理员设置的“片键”将数据分摊到自己管理的mongod集群,数据和片的对应关系以及相应的配置信息保存在"config服务器"上。

  mongod:一个普通的数据库实例,如果不分片的话,我们会直接连上mongod。

 

 -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 

另一篇mongodb分片博客:未看

啦啦啦

 

### MongoDB 分片配置与原理 MongoDB分片功能是一种分布式数据库技术,用于处理海量数据和高并发请求。以下是关于 MongoDB 分片的核心概念及其配置方法的详细介绍。 #### 1. 核心概念 - **分片 (Shard)** 数据被分割成更小的部分称为“块”,这些块分布在不同的服务器上,每台服务器被称为一个分片[^3]。 - **路由服务 (mongos)** 路由器充当客户端应用程序与分片之间的接口。它会拦截查询并将它们转发到相应的分片节点[^2]。 - **配置服务器 (Config Server)** 配置服务器保存有关整个集群元数据的信息,包括哪些分片拥有哪个范围的数据块等信息[^4]。 #### 2. 实现方法 为了实现分片,需要完成以下几个关键步骤: - **启用分片** 使用 `sh.enableSharding(<database_name>)` 命令来为指定的数据库开启分片支持。这一步骤告诉 MongoDB 将该数据库中的集合分配给多个分片[^1]。 - **定义分片键** 当前仅能针对特定集合设置分片策略。选择合适的字段作为分片键非常重要,因为它决定了如何划分数据以及后续查询效率的影响程度。通常推荐使用具有高度随机性和均匀分布特性的字段作为分片键。 - **预拆分操作** 如果预计未来会有大量写入操作,则可以提前创建一些初始块以减少动态分裂带来的开销。可以通过手动调用命令如 `splitChunk()` 来执行此过程。 #### 3. 工作流程概述 当一条记录插入到启用了分片的表中时: 1. mongos 接收到来自应用层的新文档; 2. 它依据所选分片键计算目标位置所属的具体区间; 3. 找到对应的实际物理存储地址即某个具体的 shard 后端实例; 4. 最终把这条新纪录发送过去持久化下来。 ```javascript // 示例代码:初始化分片环境 use admin; db.runCommand({ enableSharding: "testDb" }); db.runCommand({ shardCollection: "testDb.largeCollection", key: { _id: "hashed" } }); ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值