基于内存数据库的分布式数据库架构--何坤

最新推荐文章于 2024-03-12 00:18:18 发布

置顶

上善_若水

最新推荐文章于 2024-03-12 00:18:18 发布

阅读量2.6w

点赞数 1

分类专栏： DB 文章标签：数据库 mysql 磁盘 nosql 存储阿里巴巴

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tolys/article/details/5963506

版权

本文探讨了在处理海量高并发系统时，如何利用内存数据库构建两层多分区的分布式数据库架构。针对电子商务等复杂数据模型的场景，内存数据库在解决数据存储和访问问题上展现出优势。文中分析了NoSQL的局限性，MySQL集群的优化，以及内存型关系数据库的持久化和集群化策略。提出了混合分区（Hybrid Shard）的概念，以提高性能和数据一致性。此外，还讨论了内存数据库选型和高可用性的挑战。

摘要由CSDN通过智能技术生成

【摘要】本文提出了一种通过引入内存数据库层，建立两层多分区分布式数据库架构。此方案用于解决海量高并发系统的数据存储和访问问题，尤其适用于电子商务等数据模型复杂且业务复杂的互联网站。

这些年互联网站发展迅猛，为应对海量数据下的高并发访问，产生了各种分布式架构设计思想，例如Key-Value引擎，数据分区等。而对于电子商务类网站，海量数据问题还有一个重要特点，就是数据结构化及数据之间的关联，淘宝如此，阿里巴巴也是如此，这是与社区、视频、博客等互联网站的显著差异。

1. NoSQL 是灵丹妙药吗？

NoSQL、Key-Value 引擎如BigTable、Cassendra等在很多大型网站被采用，很好的解决了海量数据存储和访问问题。而对于电子商务类网站，Key-Value和NoSQL并不是解决此问题的灵丹妙药。最多它们仅能用于一些数据模型较为简单的应用。

原因有两个方面：

1）数据模型复杂

淘宝和阿里巴巴的会员、宝贝、供求、订单等核心实体数据模型复杂，属性个数几十到上百个。例如：会员(Member)就包含基本信息、联系、工商、账户等多个域的信息；另外，核心实体之间，外围实体与核心实体之间还存在复杂的关联。

2）业务复杂：

模型的复杂源于业务和逻辑的复杂。电子商务网站大量查询场景是结构化查询，例如：

在淘宝上查询“卖家在江浙沪，价格在50-200元的男士T恤”，

在阿里巴巴上“列出某个会员所有待发货的订单”

这类查询（当然，阿里巴）主要针对多个非主键字段, 即便对于BigTable、Cassandra 这样的基于Column的Key-Value数据库，其简单的Query API还无法胜任此类需求。因此在阿里巴巴和淘宝，Oracle、MySQL 等关系数据库将仍然扮演重要角色。

2. MySQL 集群

引入K-V引擎等非关系数据库无非是要解决海量数据在高并发环境下的高效读写问题，最大程度在可靠的持久化(Durable)与高访问性能 (Performance) 之间选择一个平衡点。在高度结构化系统中，同样的考虑驱使我们需要考虑另外的解决方案。

目前一种通行的做法是 MySQL 读写分离式集群，1个或少数Master写，多数Slave读，Master与Slave进行变更数据的同步。首先，这种方案经过大量的实践，可靠且可行。

然而，直接向DB执行写操作，仍然比较耗时(参见表1，表2)，数据复制，也可能存在不一致延时的情形。是否还有更快的方案？

3. 内存型关系数据库

可靠的持久化指数据存储到磁盘等设备上。图1展示了传统磁盘数据库的基本访问模式。

图1

抛开持久化的可靠性，即数据可以先不存储到磁盘上(Disk)，内存存储的性能远高于磁盘存储。下表展示了针对Oracle和Altibase所做的性能对比，后者在插入和查询上性能是Oracle的5-7倍。

数据库	测试结果	TPS
Oracle	203秒	246条<

最低0.47元/天解锁文章

关注

1
点赞
踩
25

收藏

觉得还不错? 一键收藏
7
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

上善_若水 CSDN认证博客专家 CSDN认证企业博客

码龄18年

80: 原创

16万+: 周排名

192万+: 总排名

281万+: 访问

: 等级

8990: 积分

1000: 粉丝

5: 获赞

169: 评论

47: 收藏

私信

关注

热门文章

分类专栏

.NET 6篇
C++ 6篇
computer 11篇
DB 7篇
java 44篇
PHP 11篇
Web 28篇
上善若水 2篇
炎黄子孙 6篇
程序周邊 12篇

最新评论

为jQuery添加自定义事件机制
lg251132694: 看看学习
基于内存数据库的分布式数据库架构--何坤
renjinhao123: 我觉得这个架构首先要确立的思想应该是，程序完全由内存数据库支撑，内存数据库相对于磁盘数据库是标准的数据来源，所以内存数据库的高可用性就是最重要的，而异步持久化就显得不那么重要，基本上是只要能实现就行，没必要提什么过高的要求另一个难题是，网站的确对事务没什么要求，但是作为专门处理业务的后台系统，事务就极其重要了，这个问题应该是最影响这种架构使用的
PHP发邮件问题之企业邮局账号验证失败的原因
yawuz1: 邮件接收机代码那里可以找。
JSP仿百度分页，谷歌分页页码处理
xiaosheng_papa: 判断稍有点问题哦。点下一页或点后面的页码数后面的页码会不停的增多，但前面的页码没有减少。点上一页，前面的页码也会不停的减少。

最新文章

目录

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。