【OpenStack】OpenStack中的循环任务--以Nova为例

最新推荐文章于 2023-08-13 19:14:04 发布

lynn_kong

最新推荐文章于 2023-08-13 19:14:04 发布

阅读量3.7k

点赞数

分类专栏： openstack 文章标签： openstack grizzly nova

本文链接：https://blog.csdn.net/lynn_kong/article/details/8879244

版权

openstack 专栏收录该内容

110 篇文章 10 订阅

订阅专栏

声明：
本博客欢迎转发，但请保留原作者信息!
新浪微博：@孔令贤HW；
博客地址：http://blog.csdn.net/lynn_kong
内容系本人学习、研究和总结，如有雷同，实属荣幸！

版本：Grizzly

说到循环任务，可能很多人首先想到的是python中的threading或者multiprocessing模块，使用起来相当的便利，但OpenStack有些例外。OpenStack中使用了大量的所谓的“绿色线程”（或者叫协程，与线程区别），而eventlet库基本包含了普通线程的所有操作，同时避免了线程切换带来的开销，在性能方面优于线程。关于eventlet，我并不是很懂，可以阅读其官方文档：http://eventlet.net/doc/index.html

为了实现定时循环任务，OpenStack自身又封装了eventlet实现了两种循环任务：
1. 定时间隔，即任务的两次执行会间隔特定的时间；
2. 动态间隔，即任务的第二次执行由第一次执行的返回值确定，这里要求任务要返回一个时间间隔。

以Nova为例，每个相关的Nova进程都会根据配置项来配置相关的循环任务。配置项主要有：

periodic_enable：表示是否允许执行循环任务（True/False）。
periodic_fuzzy_delay：一个时间值（单位是秒），每个进程启动时，会从这个时间值内随机选择一个时间作为循环任务的初始延迟。
periodic_interval_max：循环任务的最大执行间隔。动态间隔类型的任务使用，任务两次执行的间隔由该值和任务返回时间值的最小值确定。

1. 循环任务periodic_tasks

关于periodic_tasks，在我早期的一篇博客中有讲到（http://blog.csdn.net/lynn_kong/article/details/8244364），这里主要关注任务执行的间隔。periodic_task是动态间隔类型，一个periodic_tasks的执行，包含了许多子任务，每一个子任务又有各自不同的设置：

external_process_ok：（True/False）表示可以在单独进程中执行的任务。如果配置项run_external_periodic_tasks为False，则该属性为True的任务不在循环任务中执行（会由独立的进程执行）。
enabled：子任务是否可以执行。
spacing：子任务执行的大概的时间间隔，这个值并不是特别的精确。如果小于0，则不执行。没有设置时间间隔的子任务会在periodic_tasks的每次执行时运行。
run_immediately：（True/False）是否立即执行。

两次periodic_task的执行间隔，是idle time和periodic_interval_max的最小值决定。这里的periodic_interval_max是配置项，而idle time就跟每一个子任务的执行有关。具体来说：
1. idle time有一个初始值60s；
2. 如果所有的子任务都没有设置spacing的值，则两次periodic_task的执行间隔就是60s（从第一次执行完毕到第二次执行开始的时间间隔）
3. 如果一个子任务设置了spacing的值，但还没到执行时间，则将idle time设置为距离该子任务下次执行的等待时间；
4. 如果一个子任务成功执行，且它的spacing小于目前的idle time，则将idle time设置为spacing的值；
子任务循环结束后，periodic_task返回idle time，就是periodic_task要睡眠的时间。

上面是以periodic_task的视角来说明两次periodic_task的执行间隔如何确定。下面以某一个子任务的视角，来说明periodic_task执行时，子任务的处理策略：
1. 如果子任务没有配置spacing，执行（子任务两次执行的最小间隔是60s）；
2. 如果子任务配置了spacing，但还没到执行时间（距离上次执行的时间间隔小于spacing的值），将idle time设置为等待时间（如果等待时间小于当前的idle time的值）；

3. 如果子任务配置了spacing，并且到了执行时间，执行。将idle time设置为spacing的值（如果spacing的值小于idletime）；

2. 子任务

Nova中目前有14个子任务，分别为：
1) _check_instance_build_time
配置instance_build_timeout时执行。将BUILDING持续时间超过instance_build_timeout的虚拟机状态置为ERROR。这里不区分虚拟机是否在本节点。

2) _heal_instance_info_cache
找到本机的一个虚拟机，从Quantum获取并更新虚拟机网络信息，（instance_info_caches表）

3) _poll_rebooting_instances(libvert没有实现)
调用driver的poll_rebooting_instances方法

4) _poll_rescued_instances
配置rescue_timeout大于0时执行。对本节点中状态为rescued且持续时间大于rescue_timeout的虚拟机，执行unrescue操作

5) _poll_unconfirmed_resizes
配置resize_confirm_window 大于0时执行。resize虚拟机后（虚拟机在本机是resized状态），过了resize_confirm_window配置的时间，从migrations表中找出记录，执行confirm_resize操作

6) _instance_usage_audit
虚拟机审计。如果配置项instance_usage_audit为True，且task_log表中不存在最近一个周期(instance_usage_audit_period，默认是month)的审计记录时，执行。从数据库中获取在一个周期内存在（包括在周期内删除和新创建）的虚拟机信息，并调用notifier.notify()，同时增加task_log表的审计记录

7) _poll_bandwidth_usage(libvert没有实现)
每隔bandwidth_poll_interval运行一次，运行时调用driver的get_all_bw_counters方法，更新bw_usage_cache表

8) _poll_volume_usage（G版新增）
如果配置项volume_usage_poll_interval不等于0执行。同样使用TaskLog表的信息，如果当前时刻与上一周期开始的时间间隔大于volume_usage_poll_interval执行。首先获取本机上所有虚拟机挂载的卷，作为driver的get_all_volume_usage方法的入参（目前只有libvert实现该方法），获取卷的使用信息，更新volume_usage_cache表。

9) _report_driver_status(提供给nova-scheduler使用)
每隔host_state_interval运行一次，运行时调用driver的get_host_stats方法，更新manager对象的last_capabilities属性，这个属性会定时上报给nova-scheduler作为调度依据。内容包括：vcpu,disk,memory,hypervisor等信息。

10) _sync_power_states，虚拟机状态刷新，spacing=600
获取db中本机上的虚拟机，(会调用driver的get_num_instances方法获取虚拟机个数)，根据db中的虚拟机做循环：
a) 忽略有task_state（正在处理）的虚拟机
b) 调用driver的get_info方法获取节点虚拟机信息，若找不到，power_state=NOSTATE
c) 若db中的power_state与driver返回的power_state不一致，以driver为准，更新db
d) 若db中的vm_state=BUILDING|RESCUED|RESIZED|SUSPENDED|PAUSED|ERROR，忽略
e) 若db中的vm_state==ACTIVE，而power_state是[SHUTDOWN, CRASHED, SUSPENDED]，调用nova-api的stop接口停止虚拟机；如果power_state是[PAUSED|NOSTATE]，忽略
f) 若db中的vm_state==STOPPED，而power_state不是[NOSTATE, SHUTDOWN, CRASHED]，调用nova-api的stop接口停止虚拟机

11) _reclaim_queued_deletes
删除过期的soft_delete的虚拟机（前提：reclaim_instance_interval大于0）。

12) update_available_resource，主机资源刷新
保证主机记录的资源使用（ResourceTracker）与底层的hypervisor的使用情况一致。

13) _cleanup_running_deleted_instances，spacing=running_deleted_instance_poll_interval，默认是1800
找到本机中在DB中是deleted状态，但在虚拟化层仍然存在的虚拟机(调用driver的list_instances方法)，若删除时间大于running_deleted_instance_timeout，按照running_deleted_instance_action配置的方式处理（noop, log, reap）

14) _run_image_cache_manager_pass，spacing=image_cache_manager_interval，默认是2400
要求driver的capabilities["has_imagecache"]为True，且配置image_cache_manager_interval时执行。管理本地镜像文件缓存。就是把长时间不使用的镜像文件缓存删除掉。这里需要注意的是，使用共享存储时的时间配置。因为一个compute node不需要的镜像缓存，可能会被其他compute node使用。

lynn_kong

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
【OpenStack】OpenStack中的循环任务--以Nova为例

声明：本博客欢迎转发，但请保留原作者信息!新浪微博：@孔令贤HW；博客地址：http://blog.csdn.net/lynn_kong内容系本人学习、研究和总结，如有雷同，实属荣幸！版本：Grizzly说到循环任务，可能很多人首先想到的是python中的threading或者multiprocessing模块，使用起来相当的便利，但OpenStack有些例外。Op
复制链接

扫一扫