并行数据库

并行数据库系统是新一代高性能的书局库系统,致力于开发数据库操作的时间并行性和空间并行性,是当今研究热点之一。并行数据库技术起源于20世纪70年代的数据库机研究,希望通过硬件实现关系操作的某些功能。研究主要集中在关系代数操作的并行化和实现关系操作的专用硬件设计上。80年代后,逐步转向通用并行机的研究。90年代以后,存储技术、网络技术、微机技术的迅猛发展,以及通用并行计算机硬件的发展,为并行数据库技术的研究奠定了基础。
早期并行数据库系统的研究重点主要集中在并行数据库的物理组织、操作算法、优化和调度策络上。目前它致力于开发数据操作的时间并行性和空间并行性。关系模型仍是研究的基础,给予对象模型的并行数据库也是一个重要的研究方向。
      并行数据库系统的目标及问题
1并行数据库系统的目标
一个并行数据库系统应该实现高性能、高可用性、可扩充性等目标。
1)高性能
并行数据库系统通过将数据库管理技术与并行处理技术有机结合,发挥多处理机结构的优势,从而提供比相应的大型机系统要求高得多的性价比和可用性。例如,通过将数据库得多个磁盘上分布存储,利用多个处理机对磁盘数据进行并行处理,可以解决磁盘的瓶颈问题。通过开发查询时间并行行(不同查询并行执行)、查询并行性(同一查询内地子操作并行执行)以及其他操作内并行性(子操作并行执行),可以大大提高查询效率。
1)  可用性
并行数据库系统可通过数据复制等手段来增强数据库的可用性。这样,当一个磁盘损坏时,该攀上的数据在其他磁盘上的副本仍可供使用,且无需额外的开销(与基于日志的恢复不同)。数据复制还应与数据划分技术相结合,以保证当磁盘损坏时系统仍能并行访问数据。
2)  可扩充性
    并行数据库系统的可扩充性是指系统通过增加处理和存储能力,是器具有可平滑地扩展性能的能力。并行数据库系统可以具有两个方面的可扩充性优势:性性伸缩和线性加速。
2)并行数据库研究的问题
并行数据库特别是并行关系数据库已经成为数据库研究的热点。最近几年,伴随着MPP的发展,新的并行机分布式计算技术、计算机机群(Cluster-technology)等引起了人们的极大关注,成为十分活跃的研究领域。除了这些,目前在并行数据库领域主要有下列问题需要解决。
(1)并行体系结构。目前的并行计算机其各个处理机都具有自己独立的主存和磁盘,不共享计算机,不共享硬件资源,处理机之间的通信由高速网络实现。需要研究与这些并行计算机结构相一致的并行数据库的体系结构及有关实现技术。
(2)并行操作算法。为提高并行查询的效率,需要研究联接、句集合统计等数据操作的并行算法。
(3)并行查询优化。对并型操作的步骤进行优化组合,以进一步提高系统执行效率。
(4)并行数据库的物理设计。它包括数据分布算法的研究和数据库设计工具的研究等。
(5)并行数据库的数据加载和再组织技术。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值