传统的客户端/服务器结构是由全局事物管理器统一协调和调度事务的执行,紧耦合。
目前的分布式数据库系统采用基于中间件的客户端/服务器模式。
分布式大数据系统的体系结构:
主从(master-slave):Bigtable、Hbase
P2P环形结构:Cassandra、Dynamo
有关大数据的名词释义:
HDFS:是GFS的一种实现,他的完整名字是分布式文件系统,类似于FAT32,NTFS,是一种文件格式,是底层的。
上层的并行计算框架是MapReduce。
HBase、Bigtable:是数据库,适合于非结构化数据存储的数据库,基于列而不是行的模式。与RDBMS相比,它们更适合海量存储和实时查询处理,适合互联网环境应用。
Hive和Pig:Hive使用类SQL语言,它们类似更侧重于数据的查询和分析,底层都是转化成MapReduce程序运行。