云计算与openstack学习（一）

最新推荐文章于 2024-09-05 18:36:10 发布

weixin_34166847

最新推荐文章于 2024-09-05 18:36:10 发布

阅读量157

点赞数

文章标签：运维操作系统数据库

原文链接：http://blog.51cto.com/risingair/1867673

版权

云计算与 OpenStack

upload-ueditor-p_w_picpath-20160329-1459256505

“云计算” 算是近年来最热的词了。现在 IT 行业见面不说这三个字您都不好意思跟人家打招呼。对于云计算，学术界有各种定义，大家有兴趣可以百度一下。

CloudMan 这里主要想从技术的角度谈谈对云计算的理解。

基本概念

所有的新事物都不是突然冒出来的，都有前世和今生。云计算也是IT技术不断发展的产物。要理解云计算，需要对IT系统架构的发展过程有所认识。请看下图

upload-ueditor-p_w_picpath-20160329-1459256505

IT系统架构的发展到目前为止大致可以分为3个阶段：

1. 物理机架构

这一阶段，应用部署和运行在物理机上。比如企业要上一个ERP系统，如果规模不大，可以找3台物理机，分别部署Web服务器、应用服务器和数据库服务器。如果规模大一点，各种服务器可以采用集群架构，但每个集群成员也还是直接部署在物理机上。我见过的客户早期都是这种架构，一套应用一套服务器，通常系统的资源使用率都很低，达到20%的都是好的。

2. 虚拟化架构

摩尔定律决定了物理服务器的计算能力越来越强，虚拟化技术的发展大大提高了物理服务器的资源使用率。这个阶段，物理机上运行若干虚拟机，应用系统直接部署到虚拟机上。虚拟化的好处还体现在减少了需要管理的物理机数量，同时节省了维护成本。

3. 云计算架构虚拟化提高了单台物理机的资源使用率，随着虚拟化技术的应用，IT环境中有越来越多的虚拟机，这时新的需求产生了：如何对IT环境中的虚拟机进行统一和高效的管理。有需求就有供给，云计算登上了历史舞台。

计算（CPU/内存）、存储和网络是 IT 系统的三类资源。通过云计算平台，这三类资源变成了三个池子。当需要虚机的时候，只需要向平台提供虚机的规格。平台会快速从三个资源池分配相应的资源，部署出这样一个满足规格的虚机。虚机的使用者不再需要关心虚机运行在哪里，存储空间从哪里来，IP是如何分配，这些云平台都搞定了。

云平台是一个面向服务的架构，按照提供服务的不同分为 IaaS、PaaS 和 SaaS。请看下图

20160329205344575

IaaS（Infrastructure as a Service）提供的服务是虚拟机。 IaaS 负责管理虚机的生命周期，包括创建、修改、备份、启停、销毁等。使用者从云平台得到的是一个已经安装好镜像（操作系统+其他预装软件）的虚拟机。使用者需要关心虚机的类型（OS）和配置（CPU、内存、磁盘），并且自己负责部署上层的中间件和应用。 IaaS 的使用者通常是数据中心的系统管理员。典型的 IaaS 例子有 AWS、Rackspace、阿里云等

PaaS（Platform as a Service）提供的服务是应用的运行环境和一系列中间件服务（比如数据库、消息队列等）。使用者只需专注应用的开发，并将自己的应用和数据部署到PaaS环境中。 PaaS负责保证这些服务的可用性和性能。 PaaS的使用者通常是应用的开发人员。典型的 PaaS 有 Google App Engine、IBM BlueMix 等

SaaS（Software as a Service）提供的是应用服务。使用者只需要登录并使用应用，无需关心应用使用什么技术实现，也不需要关系应用部署在哪里。 SaaS的使用者通常是应用的最终用户。典型的 SaaS 有 Google Gmail、Salesforce 等

云计算和 OpenStack

OpenStack is a cloud operating system that controls large pools of compute, storage, and networking resources throughout a datacenter, all managed through a dashboard that gives administrators control while empowering their users to provision resources through a web interface.

以上是官网对 OpenStack 的定义，OpenStack 对数据中心的计算、存储和网络资源进行统一管理。由此可见，OpenStack 针对的是 IT 基础设施，是 IaaS 这个层次的云操作系统。

看 nova-scheduler 如何选择计算节点

upload-ueditor-p_w_picpath-20160428-1461809695

本节重点介绍 nova-scheduler 的调度机制和实现方法：即解决如何选择在哪个计算节点上启动 instance 的问题。

创建 Instance 时，用户会提出资源需求，例如 CPU、内存、磁盘各需要多少。

OpenStack 将这些需求定义在 flavor 中，用户只需要指定用哪个 flavor 就可以了。

upload-ueditor-p_w_picpath-20160428-1461809696

可用的 flavor 在 System->Flavors 中管理。

upload-ueditor-p_w_picpath-20160428-1461809696

Flavor 主要定义了 VCPU，RAM，DISK 和 Metadata 这四类。 nova-scheduler 会按照 flavor 去选择合适的计算节点。 VCPU，RAM，DISK 比较好理解，而 Metatdata 比较有意思，我们后面会具体讨论。

下面介绍 nova-scheduler 是如何实现调度的。

在 /etc/nova/nova.conf 中，nova 通过 scheduler_driver，scheduler_available_filters 和 scheduler_default_filters 这三个参数来配置 nova-scheduler。

Filter scheduler

Filter scheduler 是 nova-scheduler 默认的调度器，调度过程分为两步：

1. 通过过滤器（filter）选择满足条件的计算节点（运行 nova-compute）

通过权重计算（weighting）选择在最优（权重值最大）的计算节点上创建 Instance。

2. scheduler_driver=nova.scheduler.filter_scheduler.FilterScheduler

Nova 允许使用第三方 scheduler，配置 scheduler_driver 即可。这又一次体现了OpenStack的开放性。

Scheduler 可以使用多个 filter 依次进行过滤，过滤之后的节点再通过计算权重选出最适合的节点。

upload-ueditor-p_w_picpath-20160428-1461809696

上图是调度过程的一个示例：

最开始有 6 个计算节点 Host1-Host6

通过多个 filter 层层过滤，Host2 和 Host4 没有通过，被刷掉了

Host1，Host3，Host5，Host6 计算权重，结果 Host5 得分最高，最终入选

Filter

当 Filter scheduler 需要执行调度操作时，会让 filter 对计算节点进行判断，filter 返回 True 或 False。

Nova.conf 中的 scheduler_available_filters 选项用于配置 scheduler 可用的 filter，默认是所有 nova 自带的 filter 都可以用于滤操作。

scheduler_available_filters = nova.scheduler.filters.all_filters

另外还有一个选项 scheduler_default_filters，用于指定 scheduler 真正使用的 filter，默认值如下

scheduler_default_filters = RetryFilter, AvailabilityZoneFilter, RamFilter, DiskFilter, ComputeFilter, ComputeCapabilitiesFilter, ImagePropertiesFilter, ServerGroupAntiAffinityFilter, ServerGroupAffinityFilter

Filter scheduler 将按照列表中的顺序依次过滤。下面依次介绍每个 filter。

RetryFilter

RetryFilter 的作用是刷掉之前已经调度过的节点。

举个例子方便大家理解：假设 A,B,C 三个节点都通过了过滤，最终 A 因为权重值最大被选中执行操作。但由于某个原因，操作在 A 上失败了。默认情况下，nova-scheduler 会重新执行过滤操作（重复次数由 scheduler_max_attempts 选项指定，默认是 3）。那么这时候 RetryFilter 就会将 A 直接刷掉，避免操作再次失败。 RetryFilter 通常作为第一个 filter。

AvailabilityZoneFilter

为提高容灾性和提供隔离服务，可以将计算节点划分到不同的Availability Zone中。

例如把一个机架上的机器划分在一个 Availability Zone 中。 OpenStack 默认有一个命名为 “Nova” 的 Availability Zone，所有的计算节点初始都是放在 “Nova” 中。用户可以根据需要创建自己的 Availability Zone。

upload-ueditor-p_w_picpath-20160428-1461809696

创建 Instance 时，需要指定将 Instance 部署到在哪个 Availability Zone中。

upload-ueditor-p_w_picpath-20160428-1461809696

nova-scheduler 在做 filtering 时，会使用 AvailabilityZoneFilter 将不属于指定 Availability Zone 的计算节点过滤掉。

RamFilter

RamFilter 将不能满足 flavor 内存需求的计算节点过滤掉。

对于内存有一点需要注意：为了提高系统的资源使用率，OpenStack 在计算节点可用内存时允许 overcommit，也就是可以超过实际内存大小。超过的程度是通过 nova.conf 中 ram_allocation_ratio 这个参数来控制的，默认值为 1.5

ram_allocation_ratio = 1.5

其含义是：如果计算节点的内存有 10GB，OpenStack 则会认为它有 15GB（10*1.5）的内存。

DiskFilter

DiskFilter 将不能满足 flavor 磁盘需求的计算节点过滤掉。

Disk 同样允许 overcommit，通过 nova.conf 中 disk_allocation_ratio 控制，默认值为 1

disk_allocation_ratio = 1.0

CoreFilter

CoreFilter 将不能满足 flavor vCPU 需求的计算节点过滤掉。

vCPU 同样允许 overcommit，通过 nova.conf 中 cpu_allocation_ratio 控制，默认值为 16

cpu_allocation_ratio = 16.0

这意味着一个 8 vCPU 的计算节点，nova-scheduler 在调度时认为它有 128 个 vCPU。需要提醒的是： nova-scheduler 默认使用的 filter 并没有包含 CoreFilter。如果要用，可以将 CoreFilter 添加到 nova.conf 的 scheduler_default_filters 配置选项中。

ComputeFilter

ComputeFilter 保证只有 nova-compute 服务正常工作的计算节点才能够被 nova-scheduler调度。
ComputeFilter 显然是必选的 filter。

ComputeCapabilitiesFilter

ComputeCapabilitiesFilter 根据计算节点的特性来筛选。

这个比较高级，我们举例说明。例如我们的节点有 x86_64 和 ARM 架构的，如果想将 Instance

指定部署到 x86_64 架构的节点上，就可以利用到 ComputeCapabilitiesFilter。

还记得 flavor 中有个 Metadata 吗，Compute 的 Capabilitie s就在 Metadata中指定。

upload-ueditor-p_w_picpath-20160428-1461809696

“Compute Host Capabilities” 列出了所有可设置 Capabilities。

upload-ueditor-p_w_picpath-20160428-1461809697

点击 “Architecture” 后面的 “+”，就可以在右边的列表中指定具体的架构。

upload-ueditor-p_w_picpath-20160428-1461809697

配置好后，ComputeCapabilitiesFilter 在调度时只会筛选出 x86_64 的节点。如果没有设置 Metadata，ComputeCapabilitiesFilter 不会起作用，所有节点都会通过筛选。

ImagePropertiesFilter

ImagePropertiesFilter 根据所选 p_w_picpath 的属性来筛选匹配的计算节点。跟 flavor 类似，p_w_picpath 也有 metadata，用于指定其属性。

upload-ueditor-p_w_picpath-20160428-1461809697

例如希望某个 p_w_picpath 只能运行在 kvm 的 hypervisor 上，可以通过 “Hypervisor Type” 属性来指定。

upload-ueditor-p_w_picpath-20160428-1461809697

点击 “+”，然后在右边的列表中选择 “kvm”。

upload-ueditor-p_w_picpath-20160428-1461809697

配置好后，ImagePropertiesFilter 在调度时只会筛选出 kvm 的节点。如果没有设置 Image 的Metadata，ImagePropertiesFilter 不会起作用，所有节点都会通过筛选。

ServerGroupAntiAffinityFilter

ServerGroupAntiAffinityFilter 可以尽量将 Instance 分散部署到不同的节点上。

例如有 inst1，inst2 和 inst3 三个 instance，计算节点有 A,B 和 C。为保证分散部署，进行如下操作：

1. 创建一个 anti-affinity 策略的 server group “group-1”

2. nova server-group-create --policy anti-affinity group-1

请注意，这里的 server group 其实是 instance group，并不是计算节点的 group。

1. 依次创建 Instance，将inst1, inst2和inst3放到group-1中

2. nova boot --p_w_picpath IMAGE_ID --flavor 1 --hint group=group-1 inst1 nova boot --p_w_picpath IMAGE_ID --flavor 1 --hint group=group-1 inst2 nova boot --p_w_picpath IMAGE_ID --flavor 1 --hint group=group-1 inst3

因为 group-1 的策略是 AntiAffinity，调度时 ServerGroupAntiAffinityFilter 会将 inst1, inst2 和 inst3 部署到不同计算节点 A, B 和 C。

目前只能在 CLI 中指定 server group 来创建 instance。

创建 instance 时如果没有指定 server group，ServerGroupAntiAffinityFilter 会直接通过，不做任何过滤。

ServerGroupAffinityFilter

与 ServerGroupAntiAffinityFilter 的作用相反，ServerGroupAffinityFilter 会尽量将 instance 部署到同一个计算节点上。方法类似

1. 创建一个 affinity 策略的 server group “group-2”

2. nova server-group-create --policy affinity group-2

1. 依次创建 instance，将 inst1, inst2 和 inst3 放到 group-2 中

2. nova boot --p_w_picpath IMAGE_ID --flavor 1 --hint group=group-2 inst1 nova boot --p_w_picpath IMAGE_ID --flavor 1 --hint group=group-2 inst2 nova boot --p_w_picpath IMAGE_ID --flavor 1 --hint group=group-2 inst3

因为 group-2 的策略是 Affinity，调度时 ServerGroupAffinityFilter 会将 inst1, inst2 和 inst3 部署到同一个计算节点。

创建 instance 时如果没有指定 server group，ServerGroupAffinityFilter 会直接通过，不做任何过滤。

Weight

经过前面一堆 filter 的过滤，nova-scheduler 选出了能够部署 instance 的计算节点。如果有多个计算节点通过了过滤，那么最终选择哪个节点呢？

Scheduler 会对每个计算节点打分，得分最高的获胜。打分的过程就是 weight，翻译过来就是计算权重值，那么 scheduler 是根据什么来计算权重值呢？

目前 nova-scheduler 的默认实现是根据计算节点空闲的内存量计算权重值：空闲内存

日志

是时候完整的回顾一下 nova-scheduler 的工作过程了。整个过程都被记录到 nova-scheduler 的日志中。比如当我们部署一个 instance 时

打开 nova-scheduler 的日志 /opt/stack/logs/n-sch.log（非 devstack 安装其日志在 /var/log/nova/scheduler.log）

upload-ueditor-p_w_picpath-20160428-1461809697

日志显示初始有两个 host（在我们的实验环境中就是 devstack-controller 和 devstack-compute1），依次经过 9 个 filter 的过滤（RetryFilter, AvailabilityZoneFilter, RamFilter, DiskFilter, ComputeFilter, ComputeCapabilitiesFilter, ImagePropertiesFilter, ServerGroupAntiAffinityFilter, ServerGroupAffinityFilter），两个计算节点都通过了。

那么接下来就该 weight 了：

upload-ueditor-p_w_picpath-20160428-1461809697

可以看到因为 devstack-controller 的空闲内存比 devstack-compute1 多（7466 > 3434），权重值更大（1.0 > 0.4599），最终选择 devstack-controller。

注：要显示 DEBUG 日志，需要在 /etc/nova/nova.conf 中打开 debug 选项

[DEFAULT] debug = True

转载于:https://blog.51cto.com/risingair/1867673

weixin_34166847

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
云计算与openstack学习（一）

云计算与OpenStack“云计算”算是近年来最热的词了。现在IT行业见面不说这三个字您都不好意思跟人家打招呼。对于云计算，学术界有各种定义，大家有兴趣可以百度一下。CloudMan这里主要想从技术的角度谈谈对云计算的理解。基本概念所有的新事物都不是突然冒出来的，都有前世和今生。云计算也是IT技术不断发展的产物。要理解云计算，需要对IT系统架构的发展过程...
复制链接

扫一扫