大型分布式数据库应用的案例

最新推荐文章于 2024-04-11 14:37:38 发布

挣扎的菜鸟

最新推荐文章于 2024-04-11 14:37:38 发布

阅读量3.4k

点赞数

分类专栏：数据库

数据库专栏收录该内容

17 篇文章 0 订阅

订阅专栏

网格式大型分布式数据库中间件(Cluster Killer)

1 背景

我们知道数据是一个公司的命脉，随着业务越做越大，数据量也会越来越大，计算也会越来越复杂，性能，可靠性，可扩展性的需求就会越来越强烈，这个时候一个集中式的数据库显然已经满足不了需求了。对于技术决策者来说有两条路可以走，第一：按照现有的大型数据库的解决方案，比如SQL SERVER Cluster 或者Oracle RAC 等, 但是这也就等于走上了一条烧钱的道路，小则几十万，大则上百万乃至更多；第二：使用真正能够扩展的分布式数据库，利用中小型服务器甚至是PC 机的累加来替代大型的服务器，这也是很多公司希望的，却苦于没有合适产品，现在有了ClusterKiller ，用它真正能给您带来：高性能，高可用性，高扩展性，高性价比。

http://www.mediafire.com/?bd0bdjm2gxh 介绍的录像版本
http://www.mediafire.com/?0tygenydtdg demo的录像版本
http://www.mediafire.com/?czceymw5dxz 试用版

交流方式：msn:web668@hotmail.com;QQ: 39868224;手机：13810901198

2 方案比较

2.1 SQL SERVER的集群模式

这种结构只能说是一种故障转移的机制，当有一个节点出现问题后把负载转移到另一个节点上。在负载能力上和扩展性上没有任何办法，而且还浪费了硬件资源

2.2 Oracle Real Application Clusters (RAC)

Oracle Rac最多可支持64个节点，基本上算是解决了性能，扩展性的问题了，但是它在存储上还是一个单点，且不说出现故障怎么办，IO也可能会成为性能瓶颈。我们都知道一个数据库大到一定程度的时候，在物理上分区才能从根本上解决问题，对几十万数据进行查找和几百万上千万的数据进行查找在系统的消耗上以及响应时间上有着几何级的降低。

2.3 Cluster Killer

从图例中可以看出，下面的像网格一样的机器叫数据层，每个机器上存储着数据全集的一个分区，每一行组成一个数据全集，每一列是某个分区的多份相同的数据从而达到查询时负载均衡的效果，同时也是高可用性的保障：某个列的机器出现问题后其他的机器会负载访问。为了不让这样一个复杂的结构暴露给应用程序，在数据层上面又放了一层机器叫中间层，中间层机器的数据库中驻留着的中间件来处理SQL 语句，根据SQL 语句的类型和条件来决定由哪些机器来提供服务。在中间层的外面加一个负载均衡设备，这样应用程序或者开发/ 维护的人员通过负载均衡设备连接到中间层的任意一台机器上操作，感觉就像还在使用原来的一个数据库那样，易用性非常好。以下从各个角度具体的说明一下：

l 开发：中间件是宿主在数据库中的，所以面对数据库写SQL 语句的方式没有改变，只需要把SQL 语句从语法的角度上封装一下即可。还是利用原有的数据库的管理工具，不需要使用的新的管理工具，不需要改变原有的使用习惯，不需要学习新的知识。

l 数据库维护：对于维护表，存储过程，安全等数据库对象还是像使用一个数据库那样在中间层的任意一台机器上执行，中间件会抓取到更改并分发到其他的机器上。不会增加额外的工作量。

l 机器维护：因为这个结构比集中式的结构在机器的数量上要增加了很多，所以在机器层面上的维护成本比以前要有所增加。不过对于机器的维护不会影响整个结构的可用性，只需要在中间层的任意一台机器上更改一下配置就可以把某台机器添加到结构中或从结构中移出。

l 诊断：当出现异常后会明确的指定出错原因以及出错的机器，另外还有执行日志详细的记录每个执行步骤的细节。

l 分区：支持多种数据类型的分区，分区方式有静态分区和线形增长两种方式。静态分区不言而喻就是一开始就要规划好分区的个数；线形增长方式就是一开始只有一个或少数几个分区列，随着数据量和访问的增长的时候再添加新的分区从而达到了线性扩展的效果

l 总结：中间件的定位和作用是只是把很多的数据库服务器联合起来最终实现高扩展性，高可用性以及高性能。许多关键的数据库技术比如事务，连接池，锁，安全等还是依靠数据库来完成，无论从研发成本还是实施的风险都降到最低。

2.4 指标比较

l 故障转移/ 可靠性

n SQL SERVER Cluster ：能做到前面的计算节点的故障转移，后面的存储设备还是单点

n Oracle RAC ：能做到前面的计算节点的故障转移，后面的存储设备还是单点

n Cluster Killer ：从每个维度上都是可扩展的，所以无论从哪个维度上的机器损坏以后都能找到替代者从而实现故障转移。

l 负载均衡