云存储学习笔记4

经过我们上一章介绍块存储之后,大家应该对于块存储有了较为清晰的认知了;那么我们这一章讲讲文件存储,什么是文件存储,已经文件存储在云计算当中的使用场景。

1、 什么是文件存储?
文件存储,简单点来说就是以文件做为存储单元进行存储,那么有同学就有疑惑了,我在使用windows的时候也是以文件进行存储的呀,为啥是块存储不是文件存储呢?
这个问题就需要从原理出发讨论啦!
块存储,简单来说就是操作人员可以直接对存储设备进行操作;而文件存储则只能在存储设备上套了一层目录层,操作人员最多只能对目录层进行操作。
So,可以理解为能操作到底层存储设备的为块存储,只能接触到目录级别但是接触不到底层存储设备的为文件存储。
2、 文件存储的种类
文件存储分为本地文件存储和网络文件存储,网络文件存储也称之为NAS(网络附加存储),那么针对于系统的不同,我们将NAS分为NFS(适用于Linux&Unix系统)、CIFS(适用于Windows系统,又名SMB)。
3、 文件存储原理
从存储逻辑上来看,NAS可以与SAN进行比较,一个是网络文件存储,一个是网络块存储,我们从原理上来分析这两个的区别。
SAN:
在这里插入图片描述

从存储过程上来看,SAN存储在进行数据写入的时候本地客户端需要访问文件系统,由本地硬件将数据进行实际数据写入逻辑过程,在该过程中消耗客户端的CPU、内存进行逻辑处理,那么在不考虑后端存储的读写瓶颈的情况,将内存作为数据传递过程介质速度是非常快的。
NAS:
在这里插入图片描述

从存储过程来看,NAS在进行存储写入过程中本地客户端不需要经过文件系统层面,数据写入过程由本地应用产生后会直接通过网络传输的方式进行传递到服务端的文件系统,那么此处可以认为NAS的存储过程是将网络作为数据从目录层到文件系统的缓存过程,那么这个过程增加了大量的CPU指令周期(TCP/IP逻辑和以太网驱动程序),并且将内存换为了低速传输通道。
4、 文件存储和快存储对比
为了避免数据磁盘的单点故障,通常不会采用离散的DAS存储,而采用集中式存储或者分布式存储进行数据写入,保证数据不易丢失。
而集中式存储和分布式存储通过网络的保证数据可用性,所以我们主要讨论NAS和SAN存储的区别。
NAS存储的优缺点:
优点:成本低廉,服务端和客户端都只需要使用以太网接口即可,使用现成的网络即可使用;NAS不需要专门的设备进行数据存储,只需要做好软件配置就可以直接共享存储空间;不需要占用客户端的CPU和内存资源进行数据读写。
缺点:因为NAS直接使用以太网进行数据传递,那么传递效率不如光纤传递速度快。
SAN存储的优缺点:
优点:SAN存储可以使用FC进行数据传输,速度非常快;为了更好的兼容性和可扩展性,SAN存储可以使用现有的以太网链路传输,但是因为实际传输为SCSI语言等小数据,所以传递效率在使用同网络环境下SAN依然会比NAS速度快。
缺点:SAN需要专业的设备进行数据存储和传输,存储设备和FC设备价格普遍偏高;需要占用客户端的CPU和内存资源进行数据读写。
5、 NAS和SAN的使用场景
我们讲到这,相信大多数同学都差不多能懂了什么是文件存储和块存储了,或者说能区分NAS和SAN了,那么我们放到实际生产过程当中去看,到底啥时候用SAN或者NAS呢?
这里就要说,在运行业务的时候,我们会遇到一些比较吃CPU、内存等计算资源的服务,或者是比较吃网络延迟的服务,再或者两个都要求高。那么这就衍生出来两个名词来形容:比较吃CPU计算资源–>CPU密集;比较吃网络延迟–>IO密集
a) CPU密集
指的是某种服务或应用极度消费CPU资源,一般来说属于程序或服务逻辑复杂,但是对磁盘的IO读写需求不高(也就是说,该服务或应用更加偏向于计算而不是数据操作)比如说:RockstarGames的一款游戏:GrandTheftAutoV(就是R星的GTA5,或者可以称为侠盗猎车手5,看看是谁的DNA动了是吧),那么这款游戏的线上登录非常慢,结果黑客反编译发现需要执行19.8亿次if语句(就是做了19.8亿次条件判断,或者可以理解为问你19.8亿次:吃了没),那么这种不需要对存储做操作但是需要耗费大量的CPU资源进行判断就是CPU密集。
b) IO密集
指的是某种服务或应用极度消费存储资源,一般来说属于程序或服务需要反复读取和写入硬盘的数据,但是对CPU资源消耗不高(也就是说,该服务或应用更加偏向于数据操作而不是计算)比如说:FTP服务器。
c) IO&CPU密集
为了获取高性能,属于当前这种模式的服务或应用都不知道在单节点上继续运行了,必须采用集群来提供服务或者高性能的裸金属服务器(是一种高性能、但是可以使用集群资源的物理服务器)运行。
那么根据对于资源的使用来进行介绍,又结合上对于SAN/NAS的介绍,可以得出:
显然,NAS对于大块连续IO密集的环境,要比SAN慢一大截,原因是积累效应。经过大量IO积累之后,总体差别就显现出来了。不过,如果要使用万兆以太网这种高速网络,无疑要选用NAS,因为底层链路的速度毕竟是目前NAS的根本瓶颈。此外,如果是高并发随机小块IO环境或者共享访问文件的环境,NAS会表现出很强的相对性能。如果SAN主机上的文件系统碎片比较多,那么读写某个文件时便会产生随机小块IO,而NAS自身文件系统会有很多优化设计,碎片相对少。CPU密集的应用可以考虑使用NAS。
SAN与NAS有各自的优点和缺点,需要根据不同的环境和需求来综合考虑。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值