Java架构/一致性Hash算法在数据库分表中的实践

最新推荐文章于 2023-02-07 16:00:44 发布

Java架构师笔记

最新推荐文章于 2023-02-07 16:00:44 发布

阅读量2.2k

点赞数

分类专栏：企业架构编程语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Coco_Wditm/article/details/84655613

版权

本文介绍了在面对亿级数据时，如何使用一致性Hash算法进行数据库分表，包括方案决策、表结构、算法实现、单表拆分、数据迁移等实践过程，以及遇到的问题和改进方向。

摘要由CSDN通过智能技术生成

最近有一个项目，其中某个功能单表数据在可预估的未来达到了亿级，初步估算在90亿左右。与同事详细讨论后，决定采用一致性Hash算法来完成数据库的自动扩容和数据迁移。整个程序细节由我同事完成，我只是将其理解并成文，供有相同问题的同行参考。

参看此文的兄弟，默认各位已经熟悉一致性hash算法了。此文仅仅阐述代码细节，实现语言为Java。

项目背景

1.项目是一个实验室项目

2.其中有一个表叫做试验表，用于存储车型的试验数据，每个试验大概有6000条数据

3.总计初期约有2万个车型，每个车型初期包含超过50个试验。后期还会动态增长

4.试验表中的数据仅需要根据车型试验ID能取出来即可，没有其他更复杂的业务逻辑

方案决策

项目正式上线初期，数据量不会直接爆发式增长到90亿，需要时间上的积累（逐步做实验），最终可能达到90亿数据，甚至超过90亿数据。

按照我们实际了解情况，oracle存储数据量达到1千万的时候，性能擅可。而Oracle官方的说法，如单表存储1g有分区（大致500万数据），查询效率非常高。而试验表中仅四个字段，每条数据数据量较小。所以我们最终决定以1000万为节点，水平拆表。当表数据达到1千万时，即增加下一波表。进行数据自动迁移。

按照90亿的总量，1000万数据一个表的划分，最终大致会产生900个左右的表。所以我们最终使用了4个数据库。1个存储其他业务模块的表，3个存储此大数据表。每个数据库大致有300张表。性能上和数量上都可达到我们的要求。

相关表结构

试验信息表&

最低0.47元/天解锁文章

Java架构师笔记

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。