1、数据分类
1)结构化数据
数据库、EXCEL、XML、JSON(能够存储在数据库中)
2)半结构化数据
文档、评论(如评论账号、名称等是结构化的,但评论内容是非结构化的,有可能是表情、动图、图片)
3)非结构化数据
视频、音乐、程序包(无法存储在数据库中)
2、非结构化数据存储
1)块存储(简单理解成一块硬盘)
格式化(使用前必须格式化)
速度快(直接操作磁盘)
存储类型(各类文件)
兼容性
基于物理机本地硬盘的本地盘:基于云服务器ECS所在物理机(宿主机) 上的本地硬盘设备,为ECS实例提供本地存储访问能力。为对存储/O性能和海量存储性价比有极高要求的业务场景而设计的产品。具有低时延、高随机IOPS、高吞吐量、高性价比等优势。本地盘来自单台物理机,数据可靠性取决于物理机的可靠性,存在单点故障风险。
基于分布式存储架构的云盘(自带冗余、安全机制):数据块级别的块存储产品。云盘采用多副本的分布式机制,具有低时延、高性能、持久性、高可靠等性能,支持随时创建、扩容以及释放。
根据存储的数据类型和云盘的创建方式,云盘可以作为系统盘和数据盘使用
2)文件存储(树状结构,思路清晰)
文件系统包括文件和目录、FTP服务器
3)对象存储(每个文件都有单独的一个路径)
单个文件(理解成windows里的一个文件,如一张图片、一个word、一个音频)
3、对象存储(OSS)
存储类型(标准,低频,归档,冷归档)
本地冗余 (LRS) /同城冗余 (ZRS) ,仅限标准和低频
LRS:采用数据冗余存储机制,将每个对像的不同冗余存储在同一个可用区内多个设施的多个设备上,确保硬件失效时的数据持久性和可用性。
ZRS:采用多可用区(AZ)机制,将用户的数据分散存放在同一地域(Region)的3个可用区,当某个可用区不可用时,仍然能够保障数据的正常访问。
存储空间、对象、地域(ECS与OSS在同AZ可通过内网访问)、域名、密钥
优势:
1)方便快捷使用
控制台、API、SDK(编代码)、客户端;
不限大小;生命周期管理
2)强大灵活的安全机制
授权、多用户
3)丰富强大的增值服务
图片处理、音频转码、互联网加速、内容加速(配合CDN使用)
4)数据冗余机制
多副本冗余、无需关心底层架构
4、块存储与OSS对比
将OSS 映射为文件系统是非常低效的,也是不建议的做法,如果一定要挂 成文件系统的话,建议尽量只做写新文件、制除文件、读取文件这几种操作。使用 OSS 应该充分发挥其优点,即海量数据处理能力,优先用来存储海量的非结构化数据,比如图片、视频、文档等