数据的结构特征(结构化数据)与存储系统类型---分布式存储系统的分类

数据的结构特征

非结构化数据:包括所有格式的办公文档、文本、图片、图像、音频、视频信息等。
结构化数据:一般会存储在关系型数据库中,可用二位关系的表结构来对数据进行描述,数据的模式需要预先进行定义。
半结构化数据:介于结构化数据和半结构化数据直接,HTML文档就属于半结构化数据。它一般是自描述的,与结构化数据的最大区别之处在于,半结构化的数据模式和内容混在一起,没有明显的界限和区分。


根据分布式系统面临的各种需求,目前主要有四种分布式存储系统:分布式文件系统、分布式键值系统、分布式表格和分布式数据库

 

基于数据结构特征的存储形式

数据的结构特征决定数据的存储形式;

1、文件存储;

2、nosql;

3、sql;

 

分布式文件系统

互联网应用需要存储大量的图片、文字、照片和视频等各种非结构化的数据对象,这类数据以对象的形式进行组织,对象之间没有关联关系,这样的数据一般我们称为Blob数据。
分布式文件系统用于存储Blob数据对象,典型的系统有Facebook Haystack以及Taobao File System.另外,分布式文件系统也常作为分布式表格系统以及分布式数据库系统的底层存储。
总体上看,分布式文件系统存储三种数据:Blob对象、定长块以及大文件。在系统的实现层面,分布式文件系统内部按照数据块(chunk)来组织数据,每个数据块的大小相同,每个数据可以包含多个Blob

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值