《云数据管理:挑战与机遇》2.1 导读

《云数据管理》2.1逻辑时间和Lamport时钟


大数据和云计算是研究文献和主流媒体中大量使用的两个术语。当我们走进云计算和数据洪流的时代,经常被问到的一个问题是:云数据管理中的新挑战是什么?本书就是由我们寻求回答这个问题发展而来,并使我们自己对这一问题有了更为深入的理解。本书首先介绍了一些初步的综述性论文,这些综述论文总结了适合键–值存储系统的主要设计原则,这些系统如谷歌的Bigtable、亚马逊的Dynamo和雅虎的PNUTS,通过在一个数据中心或者有可能在世界不同地方的多个数据中心中部署成千上万台服务器来达到前所未有的规模。由于这一领域引起了学术界和工业界越来越多的研究人员的关注,该领域从键–值存储进一步发展到支持更丰富功能的可扩展数据存储,如事务或除简单键–值模型之外的模式。因此,我们将3个系统的简单综述在新加坡举办的VLDB 2010会议和在瑞典乌普萨拉举办的EDBT 2011会议扩展成一个3小时长的教程。后来又有很多相关资料的介绍,因为这些教程以及我们对该问题的理解也随时间的推移发生了改变。其间也提出了更多的系统。本书对我们这些年课程的学习以及来自于我们讲座的很多有趣的讨论进行了总结。

与传统数据管理时代事务处理与数据分析系统之间的划分一样,云数据管理也有一个类似的划分。一种是面向数据存储和服务于互联网应用的系统。这些系统与经典的事务处理系统类似,尽管有很多不同之处。另一种是数据分析系统,类似于数据仓库,通过分析大量数据来从中获得知识和智能。随着企业不断地搜集用户数据,并对来自于多种数据源的数据进行合并,基于MapReduce的系统,如Hadoop及其生态系统,使得数据分析和数据仓库更加大众化。云数据分析方面有几十个开源产品和数百篇相关领域的研究论文,已经成为一个热门的研究领域。因为企业试图从它们的数据库中获得新的见解,从而取得竞争优势,该领域会得到进一步扩展。

我们的研究、分析和调查主要关注于第一类系统,即数据管理和存储系统。因此,本书也主要关注这些系统。本书将深入探讨在设计这些更新密集型系统中存在的挑战,这些更新密集型系统必须对访问数据库小部分数据的查询和更新提供快速响应。在该类中,我们进一步将研究划分成两类系统。在第一类中,挑战在于对系统进行扩展,从而服务于拥有几千个并发请求和数百GB到数百TB频繁访问数据的大型应用。第二类包括这样一种情况,云服务提供商必须有效地服务于数十万个应用程序,每个应用程序的查询负载和资源需求都比较少。

致谢

本书源自于几年前我们试图更好地理解云数据管理设计领域的愿望。结果就有了我们对该设计领域的不断深入的理解。这得益于我们周围有很多人提供了帮助,人数太多,以至于这里无法一一列出。但是,我们想借此机会感谢那些在本书中发挥了重要作用的人。

首先,我们想感谢编辑M. Tamer zsu,他给了我们写这本书的机会,并在整个过程中为我们提供了持续的支持和反馈。他认真阅读了大量的早期草稿,并给出了很多意见和修正,大大完善了本书。Diane Cerra作为我们的出版商Morgan & Claypool的执行编辑,为我们提供了必要的行政支持。没有来自Tamer和Diane的帮助与支持,本书将无法出版。

本书中的大部分材料都以不同的形式在世界各地的不同地点呈现过。在这些演示过程中,我们收到了许多与会者的反馈,这些反馈直接或间接地改善了我们的演示,并经常会给我们提供不同的角度。我们非常感谢所有提供这些慷慨反馈的人。我们也从与Shyam Anthony、Philip Bernstein、Selcuk Candan、Aaron Elmore、Wen-syan Li、Klaus Schauser和Junichi Tatemura的大量讨论中获益匪浅,在此对他们表示感谢。我们还要感谢2008~2012年间学习研究生课程(CMPSC 271和CMPSC 274)的所有研究生的贡献。

最后,我们要感谢我们各自的家庭,他们容忍我们为准备本书和相关资料而花费了无数个小时。没有他们的一贯支持和理解,本书也不会有面世的一天。


Divyakant Agrawal、Sudipto Das和Amr El Abbadi


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值