云计算原理与实践 第五章、分布式存储

本文深入探讨分布式存储的基础,包括非结构化、结构化和半结构化数据的分类,以及分布式文件系统、键值系统、表系统和数据库。重点介绍了Google的GFS和分布式文件系统Ceph,强调Ceph的统一、分布式特性和在云计算中的应用。
摘要由CSDN通过智能技术生成

一、分布式存储的基础

1、相对于传统的存储系统,新一代的分布式存储系统有两个重要特点:低成本与大规模。

2、分布式存储分类:
(1)根据数据类型
1)非结构化数据(包括文本、图片、图像、音频和视频信息等)
2)结构化数据(对应存储在关系数据库中的二维关系表结构,结构化数据的模式和内容是分开的,数据的模式需要预先定义)
3)半结构化数据(HTML文档就是典型的半结构化数据。半结构化数据的模式结构和内容混在一起,没有明显的区分,也不需要预先定义数据的模式结构)

(2)正因为数据类型的多样性,不同的分布式存储系统适合处理不同类型的数据,因此可以将分布式存储系统分为四类:
1)分布式文件系统:互联网应用中往往需要存储大量的图片、音频、视频等非结构化数据,这类数据以对象的形式组织,一般称这样的数据为Blob(二进制大对象)数据,用分布式文件系统存储,典型的有Taobao File System(TFS)。分布式文件系统也常作为分布式表系统以及分布式数据库的底层存储,如谷歌的GFS。
分布式文件系统用来存储三种类型的数据:Blob对象、定长块以及大文件。

2)分布式键值(Key-Value)系统:用于存储关系简单的半结构化数据。(它提供基于主键的CRUD(Create、Read、Update、Delete)功能࿰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值