现在大数据概念被时常提起,社会各界对其关注度越来越高。往往越是火热的东西,人们越容易忽略它的本质。在slides中,我首先按照自己的理解,简单的理顺数据处理领域的发展历程。之后,落脚点是两个比较有代表性的混合的分布式系统:HadoopDB和微软的Polybase。由于缺乏实战经验,很多东西由各方论文和博文中得到,有不恰当的地方,欢迎大家拍砖讨论;)
slides的提纲如下:
提纲
背景
- RDBMS的出现
- 大数据时代到来
- NoSQL技术
- 新时代的挑战
HadoopDB
- PB级数据分析
- HadoopDB是什么
- 框架和组件介绍
- 示例
- 总结
Polybase
- Polybase总览
- PDW结构
- Polybase的实现
- 性能分析
slides在线展示:请戳这里
slides下载: 请戳这里
PS: 欢迎访问新博客:http://biaobiaoqi.me/blog/2013/05/20/hybrid-distributed-data-management-system/