HCIA存储技术趋势与智能存储组件
数据与信息
什么是数据
数据是对所有事物的数字表示
数据的种类
结构化数据、半结构化数据、非结构化数据
数据的处理周期
数据处理是人或机器对数据进行重组或重新排序,以增加其特定价值。数据处理包括以下基本步骤:输入、处理和输出。这三个步骤构成了数据处理周期。
什么是信息
信息是已经被处理,具有逻辑关系的数据,是对数据的解释。
信息是经过处理的数据,其中包括具有上下文,相关性和目的性的数据。
数据与信息的关系
数据经过加工处理后能够成为信息。
信息需要经过数字化转变成数据才能存储和输出。
信息生命周期管理
ILM(信息生命周期管理)是从信息产生和初始存储阶段到最后到最后过时被删除时的一台哦综合整理的方法。
数据存储
什么是数据存储
数据存储系统
存储的物理结构
数据存储分类
数据管理技术的演变
数据存储的应用
存储技术的发发展
存储架构的发展
分布式存储
通过软件将物理资源组织起来构成高性能逻辑存储池在保证可靠性的同时提供多种存储服务。
一般而言,分布式存储是将数据分散存储在多台独立的设备上,采用可扩展的系统结构、利用多台存储服务器在分担存储负荷、利用位置服务器定位信息。
存储虚拟化
存储虚拟化可以将存储设备进行抽象,以逻辑资源的方式呈现,统一提供全面的存储服务。
可以在不同的存储形态或设备类型之间提供统一的功能。
云存储
云存储系统是一个多存储设备、多应用、多服务协同工作的集体,它使用高度虚拟化的多租户基础设施为企业提供可扩展的存储资源,可以根据组织的要求动态配置。
存储介质的发展
接口协议的发展
接口协议
硬盘接口是硬盘与主机系统间的链接部件。
接口协议(Interface Protocol)指的是需要进行信息交换的接口见需要遵从的通信方式和要求。
接口协议发展简史
NVMe与NVMe-oF
存储产品的发展趋势
存储产品发展历程
智能时代的到来
智能是到对数据存储的新要求
智能时代数据存储的特征
DNA存储
少量人造DNA就能保存大量数据,并且可以冷冻干燥、运输和存储数据长达千年。
DNA作为存储介质的优势:体积小;密度大;稳定性强。
现阶段的瓶颈与局限:DNA分子合成成本高;读取和搜索数据的效率不高。
原子存储
因为原子足够小,原子存储的单位体积容量也会比现有介质更大。
有序排列原子成为了现实。
现阶段的瓶颈与局限:原子存储对运行环境要求严苛。
量子存储
如果电子被光量子取代,计算机内部信息的移动可能以光速发生。
尽管存储器的存储效率和存储寿命有所提升现阶段量子存储仍难以广泛适用。
量子存储满足的条件:高存储效率;低噪音;长寿命;室温下使用。
存储网络发展趋势
虚拟化与网络存储技术:虚拟化技术、Qemu-KVM
虚拟化技术简介
虚拟技术分类
CPU虚拟化
CPU的虚拟化技术是一种硬件方案,支持虚拟技术的CPU带有特别优化过的指令集来控制虚拟过程,通过这些指令集,VMM会很容易提高性能。
服务器虚拟化
服务器虚拟化能够通过区分资源的优先次序,并随时随地将服务器资源分配给最需要它们的工作负载来简化管理和提高效率,从而减少为单个工作负载峰值而储备的资源。
存储虚拟化
虚拟存储设备需要通过大规模的raid子系统和多个I/O通道连接到服务器上,智能控制器提供LUN访问控制、缓存和其他如数据复制等管理功能。
网络虚拟化
网络虚拟化整合后的设备组成了一个逻辑单元,在网络中表现为一个网元节点,管理简单化、配置简单化、可跨设备链路聚合,极大简化网络架构,同时进一步增强冗余可靠性。
应用虚拟化
应用虚拟化通常包括两层含义,一是应用软件的虚拟化,一是桌面的虚拟化。
Xen虚拟化技术简介
Xen虚拟化技术的优缺点
优点:
(1)Xen构建于开源的虚拟机管理程序上,结合使用半虚拟化和硬件协助的虚拟化。操作系统与虚拟化平台之间的这种协作支持开发一个较简单的虚拟机管理程序来提供高度优化的性能。
(2) Xen提供了复杂的工作负载均衡功能,可捕获CPU、内存、磁盘I/O和网络I/O数据,它提供了两种优化模式:一种针对性能,另一种针对密度。
(3) Xen利用一种名为Citrix Storage Link 的独特的存储集成功能。使用Citrix Storage Link,系统管理员可直接利用来自HP、Dell Equal Logic、NetApp、EMC等公司的存储产品。
(4) Xen包含多核处理器支持、实时迁移、物理服务器到虚拟机转换(P2V)和虚拟到虚拟转换(V2V)工具。集中化的多服务器管理、实时性能监控,以及Windows和Linux的快速性能。
缺点:
(1) Xen会占用相对较大的空间,且依赖于0号虚拟机中的Linux操作系统。
(2) Xen依靠第三方解决方案来管理硬件设备驱动程序、存储、备份和恢复,以及容错 任何具有高I/O速率的操作或任何会吞噬资源的操作都会使Xen陷入困境,使其他虚拟机缺乏资源。
(3) Xen缺少802.1Q 虚拟局域网(VLAN)中继,出于安全考虑,它没有提供目录服务集成、基于角色的访问控制、安全日志记录和审计或管理操作。
(4) Xen目前最大的困难在于Linux内核社区的抵制,导致XEN相关的内核改动一直不能顺利进入内核源代码,从而无法及时得到内核最新开发成果的支持。
KVM虚拟化技术简介
(1)开源:KVM 一个开源项目,这就决定了KVM一直是开放的姿态,许多虚拟化的新技术都是首先在KVM上应用,再到其他虚拟化引擎上推广。
(2)性能:KVM吸引许多人使用的一个动因就是性能,在同样的硬件条件下,能提供更好的虚拟机性能,主要是因为KVM架构简单,代码只有2万行,一开始就支持硬件虚拟化,这些技术特点保证了KVM的性能。
(3)免费:KVM因为是开源项目,绝大部分KVM的解决方案都是免费方案,随着KVM的发展,KVM虚拟机越来越稳定,兼容性也越来越好,因而也就得到越来越多的应用。
(4)技术支持:免费并不意味着KVM没有技术支持。在KVM的开源社区,数量巨大的KVM技术支持者都可以提供KVM技术支持。另外,如果需要商业级支持,也可以购买红帽公司的服务。
KVM虚拟化技术的未来
红帽RHEV虚拟化系统简介
RHEV(Red Hat Enterprise Virtualization)红帽企业虚拟化,是一个服务器虚拟化的管理平台。由RHEV-M(Manager)、RHEV-H(Hypersior)和存储组成,能够简便、集中的对KVM虚拟机进行创建、删除、迁移、快照等操作,实现企业服务器物理资源的充分使用。是一种非常适合中小型企业的虚拟化解决方案。
RHEV虚拟化技术的优缺点
优点:
(1)性能和可扩展性:为实现企业级的虚拟化应用程序,如Oracle、SAP和Microsoft Exchange,为其提供领先的性能和可扩展性。
(2)安全性:业界领先的安全性,在安全增强型红帽企业Linux内核基础上构建。
(3)企业功能:业虚拟化管理功能,包括实时迁移、高可用性、负载均衡、节能等。
(4)灵活性:通过消除桌面操作系统和基础硬件之间的依赖性,实现业务灵活性和连续性。
(5)成本优势:与其他解决方案相比较,凭借红帽软件订阅模式的强大功能,能够以更低的购置和总拥有成本获得相同或更好的功能集,从而获得收益。
缺点:
(1)技术不成熟:KVM的出现不过三四年时间,在可用资源、平台支持、管理工具、实施经验方面当然不能与出现8年之久的Xen相比。
(2)需要Windows支持;KVM3.0之前的RHEV-M管理程序需要Windows支持,这是KVM在部署过程中最大的障碍,RedHat公司已经意识到这个问题的严重性,从KVM3.0开始,开发出基于Linux的RHEV-M,取消了其只能运行于Windows服务器上的尴尬,这一改动得到大量Linux用户的支持。
(3)管理的物理服务器数量少,每台M端只能管理500台以内的H端服务器。
其他虚拟化技术介绍
VMware
(1)VMware Workstation
VMware Workstation是VMware公司销售的运行于台式机和工作站上的虚拟化软件,也是VMware公司第一个面市的产品(1999年5月)。该产品最早采用了VMware在业界知名的二进制翻译技术,在x86 CPU硬件虚拟化技术还未出现之前,为客户提供了纯粹的基于软件的全虚拟化解决方案。
(2)VMware ESX Server
ESX服务器(一种能直接在硬件上运行的企业级的虚拟平台),虚拟的SMP,它能让一个虚拟机同时使用四个物理处理器,和VMFS一样,它能使多个ESX服务器分享块存储器。
Virtual Box
Oracle VirtualBox是由德国InnoTek软件公司出品的虚拟机软件,现在由甲骨文公司进行开发,是甲骨文公司xVM虚拟化平台技术的一部分。它提供使用者在32位或64位的Windows、Solaris及Linux操作系统上虚拟其他X86的操作系统。使用者可以在VirtualBox上安装并执行Solaris、Windows、DOS、Linux、OS/2 Warp、OpenBSD及FreeBSD等操作系统作为客户端操作系统。最新的VirtualBox还支持运行Android4.0系统。
Hyper-V
Hyper-V是微软提出的一种系统管理程序虚拟化技术。Hyper-V设计的目的是为广泛的用户提供更为熟悉及成本效益更高的虚拟化基础设施软件,这样可以降低运作成本、提高硬件利用率、优化基础设施并提高服务器的可用性。
Hyper-V的设计借鉴了Xen,采用微内核的架构,兼顾了安全性和性能的要求。Hyper-V底层的Hypervisor运行在最高的特权级别下,微软将其称为ring-1(而Intel也将其称为root mode),而虚拟机的操作系统内核和驱动运行在ring0,应用程序运行在ring3。
Qemu-KVM介绍
KVM原理简介
KVM工作流程
用户模式的qemu利用libkvm通过ioctl进入内核模式,kvm模块为虚拟机创建虚拟内存,虚拟CPU后执行VMLauch指令进入客户模式。加载Guest OS并执行。如果Guest OS 发生外部中断或者影子页表缺页之类的情况,会暂停Guest OS的执行,退出客户模式,执行异常处理,之后重新进入客户模式,执行客户代码。如果发生I/O事件或者信号队列中有信号到达,就会进入用户模式处理。
KVM架构
如图所示,左侧部分是一个标准的Linux操作系统,可以是RHEL、Fedora、Ubuntu等。KVM内核模块在运行时按需加载进入内核空间运行。KVM本身不执行任何设备模拟,需要用户空间程序QEMU通过/dev/kvm接口设置一个虚拟客户机的地址空间,向它提供模拟的I/O设备,并将它的视频显示映射回宿主机的显示屏。
KVM模块
KVM模块是KVM虚拟机的核心部分。其主要功能是初始化CPU硬件,打开虚拟化模式,然后将虚拟客户机运行在虚拟机模式下,并对虚拟客户机的运行提供一定的支持。
KVM模块加载之初,只存在/dev/kvm文件,而针对该文件的最重要的IOCTL调用就是“创建虚拟机”。在这里,“创建虚拟机”可以理解成KVM为了某个特定的虚拟客户机(用户空间程序创建并初始化)创建对应的内核数据结构。
处理器对设备的访问主要是通过IO指令和MMIO,其中IO指令会被处理器直接截获,MMIO会通过配置内存虚拟化来捕捉。但是,外设的模拟一般并不由KVM模块负责。一般来说,只有对性能要求比较高的虚拟设备才会由KVM内核模块来直接负责,比如虚拟终端控制器和虚拟时钟,这样可以大量减少处理器的模式切换的开销。
Qemu原理介绍
Qemu架构
Qemu是纯软件实现的虚拟化模拟器,几乎可以模拟任何硬件设备,是一个完整的可以运行的软件,非常灵活可移植,我们最熟悉的就是能够模拟一台能够独立运行操作系统的虚拟机,虚拟机认为自己和硬件打交道,但其实是和Qemu模拟出来的硬件打交道,Qemu将这些指令转译给真正的硬件。
Qemu模块
QEMU本身并不是KVM的一部分,其自身就是一个著名的开源虚拟机软件。与KVM不同,QEMU虚拟机是一个纯软件的实现,所以性能地下。但是,其优点是在支持QEMU本身编译运行的平台上就可以实现虚拟机的功能,甚至虚拟机可以与宿主机并不是同一个架构。作为一个存在已久的虚拟机,QEMU的代码中有整套的虚拟机实现,包括处理器虚拟化、内存虚拟化,以及KVM使用到的虚拟设备模拟(比如网卡、显卡、存储控制器和硬盘等)。
从QEMU和KVM模块之间的关系可以看出,这是典型的开源社区在代码共用和开发项目共用上面的合作。诚然,QEMU可以选择其他的虚拟机或技术来加速,比如Xen或者KQEMU;KVM也可以选择其他的用户空间程序作为虚拟机实现,只要它按照KVM提供的API来设计。但是在现实中,QEMU与KVM两者的结合是最成熟的选择,这对一个新开发和后起的项目(KVM)来说,无疑多了一份未来成功的保障。
Qemu的三种运行模式
1)第一种模式是通过kqemu模块实现内核态的加速。
2)第二种模式是在用户态直接运行QEMU,由QEMU对目标机的 所有 指令进行翻译后执行,相当于全虚拟化。
3)第三种模式则是KVM官方提供的kvm-qemu加速模式。
Qemu的特点
(1)QEMU的两种操作模式:完整的系统仿真和用户模式仿真。
(2)QEMU具有以下特点:
lQEMU可以在没有主机内核驱动程序的情况下运行。
l它适用于多种操作系统(GNU / Linux,* BSD,Mac OS X,Windows)和体系结构。
l它执行FPU的精确软件仿真。
(3)QEMU用户模式仿真具有以下功能:
通用Linux系统调用转换器,包括大部分ioctls。
使用本机CPU clone的仿真为线程使用Linux调度程序。
通过将主机信号重新映射到目标信号来实现精确信号处理。
(4)QEMU全系统仿真具有以下特点:
QEMU使用完整的软件MMU来实现最大的便携性。
lQEMU可以选择使用内核加速器,如kvm。加速器本地执行大部分客户代码,同时继续模拟机器的其余部分。
l可以仿真各种硬件设备,并且在某些情况下,客户机操作系统可以透明地使用主机设备(例如串行和并行端口,USB,驱动器)。主机设备传递可用于与外部物理外围设备(例如网络摄像头,调制解调器或磁带驱动器)交谈。
l对称多处理(SMP)支持。目前,内核加速器需要使用多个主机CPU进行仿真。
KVM和Qemu的关系
lQemu是一个独立的虚拟化解决方案,通过intel-VT 或AMD SVM实现全虚拟化,安装qemu的系统,可以直接模拟出另一个完全不同的系统环境。QEMU本身可以不依赖于KVM,但是如果有KVM的存在并且硬件(处理器)支持比如Intel VT功能,那么QEMU在对处理器虚拟化这一块可以利用KVM提供的功能来提升性能。
lKVM是集成到Linux内核的Hypervisor,是X86架构且硬件支持虚拟化技术(Intel-VT或AMD-V)的Linux的全虚拟化解决方案。它是Linux的一个很小的模块,利用Linux做大量的事,如任务调度、内存管理与硬件设备交互等。准确来说,KVM是Linux kernel的一个模块。
Qemu工具介绍
qemu-img
qemu-img是QEMU的磁盘管理工具,在qemu-kvm源码编译后就会默认编译好qemu-img这个二进制文件。qemu-img也是QEMU/KVM使用过程中一个比较重要的工具。下面我们将几条重要的选项讲解一下。
qemu-kvm
此命令用于创建虚拟机,其使用格式为“qemu-kvm [options] [disk_image]”,其选项非常多,
大致可分为如下几类:
qemu-ga
qga是一个运行在虚拟机内部的普通应用程序(可执行文件名称默认为qemu-ga,服务名称默认为qemu-guest-agent),其目的是实现一种宿主机和虚拟机进行交互的方式,这种方式不依赖于网络,而是依赖于virtio-serial(默认首选方式)或者isa-serial,而QEMU则提供了串口设备的模拟及数据交换的通道,最终呈现出来的是一个串口设备(虚拟机内部)和一个unix socket文件(宿主机上)。
qga通过读写串口设备与宿主机上的socket通道进行交互,宿主机上可以使用普通的unix socket读写方式对socket文件进行读写,最终实现与qga的交互,交互的协议与qmp(QEMU Monitor Protocol)相同(简单来说就是使用JSON格式进行数据交换),串口设备的速率通常都较低,所以比较适合小数据量的交换。
qemu-io
这是一个执行 Qemu I/O 操作的命令行工具,可以对qemu-img创建的镜像进行I/O测试,其帮助文档为,使用格式为qemu-io [-h] [-V] [-rsnm] [-c cmd] ... [file],下面是常用的选项:
(1)-c, --cmd:执行指令;
(2)-r, --read-only:设置出口为只读模式;
(3)-s, --snapshot:使用快照文件进行测试;
(4)-n, --nocache:禁用主机缓存;
(5)-k, --native-aio:使用内核AIO实现(仅在Linux上);
(6)-t, --cache=MODE:对image使用指定的缓存模式。
qemu-nbd
qemu-nbd在有的系统上叫kvm-nbd,qemu-nbd-xen等。基本上都一样。用qemu-nbd实现mount虚拟硬盘到Host上的功能。
网络块设备: Network Block Device。可以将一个远程主机的磁盘空间,当作一个块设备来使用,就像一块硬盘一样。使用它,可以很方便的将另一台服务器的硬盘空间增加到本地服务器上。
NBD与NFS有所不同,NFS只是提供一个挂载点供客户端使用,客户端无法改变这个挂载点的分区格式。而NBD提供的是一个块设备,客户端可以把这个块设备格式化成各种类型的分区,更便于用户的使用。
Qemu支持的磁盘格式介绍
qemu-img
qemu-img支持非常多种的文件格式,我们可以通过“qemu-img --help”查看帮助文档得到,它支持二十多种格式:vvfat、vpc、vmdk、vhdx、vdi、ssh、sheepdog、rbd、raw、host_cdrom、host_floppy、host_device、file qed、qcow2、qcow、parallels、nbd、iscsi、gluster、 dmg、tftp、ftps、ftp、https、http、cloop、bochs、blkverify、blkdebug。
下面对其中几种常用的文件格式做简单的介绍:
raw
raw格式是简单的二进制镜像文件,一次性会把分配的磁盘空间占用。
host_device
在需要将镜像转化到不支持空洞的磁盘设备时需要用这种格式来代替raw格式。
qcow2
qcow2是QEMU目前推荐的镜像格式,它是功能最多的格式。
qcow
较旧的QEMU镜像格式,现在已经很少使用了,一般用于兼容比较老版本的QEMU。它支持backing_file(后端镜像)和encryption(加密)两个选项。
cow
copy-on-write format,写时复制格式。曾经qemu的写时拷贝的镜像格式,目前由于历史遗留原因不支持窗口模式,后来被qcow格式所取代。
vdi
兼容Oracle(Sun)VirtualBox1.1的镜像文件格式(Virtual Disk Image)
vmdk
VMDK(VMWare Virtual Machine Disk Format)是虚拟机VMware创建的虚拟硬盘格式,文件存在于VMware文件系统中,被称为VMFS(虚拟机文件系统)。
vpc
兼容Microsoft的Virtual PC的镜像文件格式(Virtual Hard Disk format)。
sheepdog
Sheepdog项目是由日本的NTT实验室发起的,为QEMU/KVM做的一个开源的分布式存储系统,为KVM虚拟化提供块存储。
cloop
压缩的loop格式,主要用于可直接引导优盘或者光盘的一种镜像格式。
Qemu-KVM虚拟化环境搭建
Qemu-img生产虚拟机硬盘
Qemu-KVM命令创建虚拟机
初学,做的不好请见谅!