数据库总结：分区

gengzhe2020

于 2022-10-18 23:37:18 发布

阅读量209

点赞数

分类专栏：数据库文章标签：数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gengzhe2010/article/details/127392935

版权

数据库专栏收录该内容

6 篇文章 0 订阅

订阅专栏

分区

分区通常与复制结合使用，即每个分区在多个节点都存在副本。

要解决的问题：将数据和查询负载均匀分布在所有节点

关键字：会导致热点问题；
时间戳：会导致某时间段负载过高问题；

如何分区

一般基于 K-V数据模型尝尝基于哈希算法（redis）；
二级索引分区，适用于关系型数据库、文档型数据库（MongoDB）；

关于对关键字（热点）数据存储导致的负载倾斜的问题

举例：对名人热点等关键字访问，会出现同时对相同关键字的操作。
一般解决方案是在应用层减轻倾斜程度，如对关键字加一个随机数，使其分布到100个不同的分区上，但随之而来的是之后的读取都需要此额外工作，因此只对少量热点关键字加随机数才有意义，因此还需额外标记哪些元数据进行了处理。
哈希函数：好的哈希函数可处理数据倾斜并使其均匀分布。如取时间戳的MD5哈希值得头2个字节，缺点是哈希丧失区间查询特性。

关于哈希算法和一致性哈希算法使用场景的问题

哈希算法：也就是取模算法（对机器数量取模），如一个集群有3台实例，能快速定位某个key存在那个实例上，缺陷是，当扩容时，需要将历史数据重新哈希，此间隔中缓存失效，会导致穿透雪崩。
一致性哈希算法（也是取模，但是对2^32取模）：一致性Hash算法对于节点的增减都只需重定位环空间中的一小部分数据，不至于将所有压力都在同一时间集中到后端服务器上，具有较好的容错性和可扩展性。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据库总结：分区

数据库分区遇到的问题
复制链接

扫一扫

专栏目录

gengzhe2020 CSDN认证博客专家 CSDN认证企业博客

码龄14年

20: 原创

21万+: 周排名

32万+: 总排名

4508: 访问

: 等级

217: 积分

3: 粉丝

5: 获赞

9: 评论

5: 收藏

私信

关注

热门文章

分类专栏

笔记 13篇
数据库 6篇
sping 4篇
jvm

最新评论

Synchronized 对象锁和类锁
丶栀子丶: 举例，没有例子哈哈哈哈哈
RocketMq 总结
water___Wang: 受教了~
线程安全与同步总结
水巷石子: 大佬，我准备跟你混了！
线程安全与同步总结
不正经的kimol君: 代码之路任重道远，愿跟博主努力习之。
RocketMq 总结
盼盼编程: 写的好，很nice!欢迎一起交流!

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。