文章目录 前言 数据分区与数据复制 键-值数据的分区 基于关键字区间分区 基于关键字哈希值分区 负载倾斜与热点 分区与二级索引 基于文档分区的二级索引 基于词条的二级索引分区 分区再平衡 动态再平衡策略 为什么不用取模 固定数量分区 动态分区 按节点比例分区 自动与手动再平衡操作 请求路由 并行执行查询 前言 什么情况下需要对数据进行分区? 海量数据或者IO压力非常大的时候。 分区也叫分片。在不同系统有不同的称呼:MongoDB,Elasticsearch,SolrCloud-shard;HBase-region;Bigtable-tablet;Cassandra-vnode;Couchbase-vBucket。 分区的定义通常是指每一条数据只属于某个特定的分区。分区的主要目的是提高可扩展性。 数据分区与数据复制 数据分区与数据复制通常结合使