Playbook
1. Ansible Playbook与临时命令
临时命令可以作为一次性命令对一组目标主机运行一项简单的任务。不过,若要真正发挥Ansible的力量,需要了解如何使用playbook以便轻松重复的方式对一组目标主机执行多项复杂的任务。
play是针对清单中选定的主机运行的一组有序任务。playbook是一个文本文件,其中包含由一个或多个按特定顺序运行的play组成的列表。
Play可以将一系列冗长而复杂的手动管理任务转变为可轻松重复的例程,并且具有可预测的成功成果。在playbook中,可以将play内的任务序列保存为人类可读并可立即运行的形式。根据任务的编写方式,任务本身记录了部署应用或基础架构所需的步骤。
2. 格式化Ansible Playbook
前面我们学习了临时命令模块,下面以一条命令做为案例来讲解下其在playbook中是如何编写的。
[root@node1 ansible]# ansible 192.168.200.153 -m user -a 'name=abc uid=600 state=present'
192.168.200.153 | CHANGED => {
"ansible_facts": {
"discovered_interpreter_python": "/usr/libexec/platform-python"
},
"changed": true,
"comment": "",
"create_home": true,
"group": 4001,
"home": "/home/abc",
"name": "abc",
"shell": "/bin/bash",
"state": "present",
"system": false,
"uid": 600
}
上面我们是用user模块来实现对对面的用户创建,那么我们现在用ansible中的paylbook(剧本)来实现在受管主机上创建用户。
[root@node1 ansible]# vim syb.yml
---
- name: test1
hosts: 192.168.200.153
tasks:
- name: create test1 for user
user:
name: test1
uid: 2000
state: present
[root@node1 ansible]# ansible-playbook syb.yml
PLAY [test1] *******************************************************************
TASK [Gathering Facts] *********************************************************
ok: [192.168.200.153]
TASK [create test1 for user] ***************************************************
changed: [192.168.200.153]
PLAY RECAP *********************************************************************
192.168.200.153 : ok=2 changed=1 unreachable=0 failed=0 skipped=0 rescued=0 ignored=0
[root@node2 ~]# id test1
uid=2000(test1) gid=2000(test1) 组=2000(test1)
Playbook是以YAML格式编写的文本文件,通常使用扩展名yml保存。Playbook使用空格字符缩进来表示其数据结构。YAML对用于缩进的空格数量没有严格的要求,但有两个基本的规则:
处于层次结构中同一级别的数据元素(例如同一列表中的项目)必须具有相同的缩进量。
如果项目属于其他项目的子项,其缩进量必须大于父项
只有空格字符可用于缩进,不允许使用tab键。约定俗成的缩进量一般是一级2个空格。
Playbook开头的一行由三个破折号(—)组成,这是文档开始标记。其末尾可能使用三个圆点(…)作为文档结束标记,尽管在实践中这通常会省略。
在这两个标记之间,会以一个play列表的形式来定义playbook。YAML列表中的项目以一个破折号加空格开头。例如,YAML列表可能显示如下:
[root@node1 ansible]# cat syb.yml
---
- name: test1 //开头一行必须加-
hosts: 192.168.200.153
tasks:
- name: create test1 for user //这里也要加-
user:
name: test1
uid: 2000
state: present
Play本身是一个键值对集合。同一play中的键应当使用相同的缩进量。以下示例显示了具有三个键的YAML代码片段。前两个键具有简单的值。第三个将含有三个项目的列表作为值,我们在这里为受管主机安装一个vsftpd服务,并且设置开机启动。
[root@node1 ansible]# cat vsftpd.yml
---
- hosts: 192.168.200.153
tasks:
- name: vsftpd
yum:
name: vsftpd
state: present
- name: service vsftpd
service:
name: vsftpd
state: started
enabled: yes
[root@node1 ansible]# ansible-playbook vsftpd.yml
PLAY [192.168.200.153] *********************************************************
TASK [Gathering Facts] *********************************************************
ok: [192.168.200.153]
TASK [vsftpd] ******************************************************************
ok: [192.168.200.153]
TASK [service vsftpd] **********************************************************
ok: [192.168.200.153]
PLAY RECAP *********************************************************************
192.168.200.153 : ok=3 changed=0 unreachable=0 failed=0 skipped=0 rescued=0 ignored=0
[root@node2 ~]# rpm -qa | grep vsftpd
vsftpd-3.0.3-31.el8.x86_64
[root@node2 ~]# systemctl status vsftpd
● vsftpd.service - Vsftpd ftp daemon
Loaded: loaded (/usr/lib/systemd/system/vsftpd.service; enabled; ven>
Active: active (running) since Tue 2021-07-20 13:41:30 CST; 18min ago
Process: 995 ExecStart=/usr/sbin/vsftpd /etc/vsftpd/vsftpd.conf (code
作为play中的一部分,tasks属性按顺序实际列出要在受管主机上运行的任务。列表中各项任务本身是一个键值对集合。
还以上面创建用户的play为例,play中唯一任务有两个键:
name是记录任务用途的可选标签。最好命名所有的任务,从而帮助记录自动流程中的每一步用途。
user是要为这个任务运行的模块。其参数作为一组键值对传递,它们是模块的子项(name、uid和state)。
下面再来看一个含有多项任务的tasks属性案例:
[root@node1 ansible]# cat vsftpd.yml //可以发现三个任务是对齐的
---
- hosts: 192.168.200.153
tasks:
- name: vsftpd
yum:
name: vsftpd
state: present
- name: service vsftpd
service:
name: vsftpd
state: started
enabled: yes
- name: config vsftpd
copy:
src: /syb/vsftpd.conf
dest: /etc/vsftpd/vsftpd.conf
playbook中play和任务列出的顺序很重要,因为Ansible会按照相同的顺序运行它们。
3. 运行playbook
absible-playbook命令可用于运行playbook。该命令在控制节点上执行,要运行的playbook的名称则作为参数传递。
[root@node1 ansible]# ansible-playbook vsftpd.yml
//我们执行的时候,文件在哪里,就要加上它的路径,然后执行
在运行playbook时,将生成输出来显示所执行的play和任务。输出中也会报告执行的每一项任务的结果。
以下示例中显示了一个简单的playbook的内容,后面是运行它的结果。
[root@node1 ansible]# cat vsftpd.yml
---
- hosts: 192.168.200.153
tasks:
- name: vsftpd
yum:
name: vsftpd
state: present
- name: service vsftpd
service:
name: vsftpd
state: started
enabled: yes
- name: config vsftpd
copy:
src: /syb/vsftpd.conf
dest: /etc/vsftpd/vsftpd.conf
[root@node1 ansible]# ansible-playbook vsftpd.yml
PLAY [192.168.200.153] *********************************************************
TASK [Gathering Facts] *********************************************************
ok: [192.168.200.153]
TASK [vsftpd] ******************************************************************
ok: [192.168.200.153]
TASK [service vsftpd] **********************************************************
ok: [192.168.200.153]
TASK [config vsftpd] ***********************************************************
ok: [192.168.200.153]
PLAY RECAP *********************************************************************
192.168.200.153 : ok=4 //执行成功的 changed=0 unreachable=0 failed=0 skipped=0 rescued=0 ignored=0
请注意,在playbook运行时,屏幕中会显示每个play和任务的name键的值。(Gathering Facts任务是一项特别的任务,setup模块通常在play启动时自动运行这项任务。)对于含有多个play和任务的playbook,设置name属性后可以更加轻松地监控playbook执行的进展。
通常而言,Ansible Playbook中的任务是幂等的,而且能够安全地多次运行playbook。如果目标受管主机已处于正确的状态,则不应进行任何更改。如果再次运行这个playbook,所有任务都会以状态OK传递,且不报告任何更改。
4. 提高输出的详细程度
ansible-playbook命令提供的默认输出不提供详细的任务执行信息。ansible-playbook -v命令提供了额外的信息,总共有四个级别。
配置Playbook执行的输出详细程序
选项 | 描述 |
---|---|
-v | 显示任务结果 |
-vv | 任务结果和任务配置都会显示 |
-vvv | 包含关于与受管主机连接的信息 |
-vvvv | 增加了连接插件相关的额外详细程序选项,包括受管主机上用于执行脚本的用户以及所执行的脚本 |
5. 语法验证
在执行playbook之前,最好要进行验证,确保其内容的语法正确无误。ansible-playbook命令提供了一个–syntax-check选项,可用于验证playbook的语法。
下例演示了一个playbook成功通过语法验证:
[root@node1 ansible]# ansible-playbook vsftpd.yml
PLAY [192.168.200.153] *********************************************************
TASK [Gathering Facts] *********************************************************
ok: [192.168.200.153]
TASK [vsftpd] ******************************************************************
ok: [192.168.200.153]
TASK [service vsftpd] **********************************************************
ok: [192.168.200.153]
TASK [config vsftpd] ***********************************************************
ok: [192.168.200.153]
PLAY RECAP *********************************************************************
192.168.200.153 : ok=4 changed=0 unreachable=0 failed=0 skipped=0 rescued=0 ignored=0
语法验证失败时,将报告语法错误。输出中包含语法问题在playbook中的大致位置。
下例演示了一个playbook语法验证失败的情况:
[root@node1 ansible]# ansible-playbook vsftpd.yml
PLAY [192.168.200.153] *********************************************************
TASK [Gathering Facts] *********************************************************
ok: [192.168.200.153]
TASK [vsftpd] ******************************************************************
ok: [192.168.200.153]
TASK [service vsftpd] **********************************************************
fatal: [192.168.200.153]: FAILED! => {"changed": false, "msg": "Unsupported parameters for (systemd) module: enable Supported parameters include: daemon_reexec, daemon_reload, enabled, force, masked, name, no_block, scope, state, user"}
PLAY RECAP *********************************************************************
192.168.200.153 : ok=2 changed=0 unreachable=0 failed=1 skipped=0 rescued=0 ignored=0
6. 执行空运行
可以使用-C选项对playbook执行空运行。这会使Ansible报告在执行该playbook时将会发生什么更改,但不会对受管主机进行任何实际的更改。
下例演示了一个playbook的空运行,它包含单项任务,可确保在受管主机上安装了最新版本的httpd软件包。注意该空运行报告此任务会对受管主机产生的更改。
[root@node1 ansible]# ansible-playbook -C vsftpd.yml
PLAY [192.168.200.153] *********************************************************
TASK [Gathering Facts] *********************************************************
ok: [192.168.200.153]
TASK [vsftpd] ******************************************************************
ok: [192.168.200.153]
TASK [service vsftpd] **********************************************************
ok: [192.168.200.153]
TASK [config vsftpd] ***********************************************************
ok: [192.168.200.153]
PLAY RECAP *********************************************************************
192.168.200.153 : ok=4 changed=0 unreachable=0 failed=0 skipped=0 rescued=0 ignored=0
7. 缩写多个play
Playbook是一个YAML文件,含有由一个或多个play组成的列表。记住一个play按顺序列出了要对清单中的选定主机执行的任务。因此,如果一个playbook中有多个play,每个play可以将其任务应用到单独的一组主机。
在编排可能涉及对不同主机执行不同任务的复杂部署时,这会大有帮助。我们可以这样进行编写:对一组主机运行一个play,完成后再对另一组主机运行另一个play。
缩写包含多个play的playbook非常简单。Playbook中的各个play编写为playbook中的顶级列表项。各个play是含有常用play关键字的列表项。
- name: first play //第一个主机的任务
hosts: 172.16.103.129
tasks:
- name: first task
yum:
name: httpd
status: present
- name: second task
service:
name: httpd
enabled: true
- name: second play //第二个主机的任务
hosts: 172.16.103.131
tasks:
- name: first task
service:
name: mariadb
enabled: true
8. play中的远程用户和特权升级
Play可以将不同的远程用户或特权升级设置用于play,取代配置文件中指定的默认设置。这些在play本身中与hosts或tasks关键字相同的级别上设置。
9. 用户属性
playbook中的任务通常通过与受管主机的网络连接来执行。与临时命令相同,用于任务执行的用户帐户取决于Ansible配置文件/etc/ansible/ansible.cfg中的不同关键字。运行任务的用户可以通过remote_user关键字来定义。不过,如果启用了特权升级,become_user等其他关键字也会发生作用。
如果用于任务执行的Ansible配置中定义的远程用户不合适,可以通过在play中使用remote_user关键字覆盖。
# (/usr/bin/ansible will use current user as default)
remote_user = root //可以修改这里
# logging is off by default unless this path is defined
10. 特权升级属性
Ansible也提供额外的关键字,从而在playbook内定义特权升级参数。become布尔值关键字可用于启用或禁用特权升级,无论它在Ansible配置文件中的定义为何。它可取yes或true值来启用特权升级,或者取no或false值来禁用它。
如果启用了特权升级,则可以使用become_method关键字来定义特定play期间要使用的特权升级方法。
此外,启用了特权升级时,become_user关键字可定义特定play上下文内要用于特权升级的用户帐户。
[privilege_escalation]
#become=True
#become_method=sudo
#become_user=root
#become_ask_pass=False
以下示例演示了如何在play中使用这些关键字:
[root@node1 ansible]# cat /etc/hosts
127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4
::1 localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.200.153 node2 //这是已经把受管主机ip和名字写过来了
[root@node1 ansible]# cat syb.yml
---
- name: test1
hosts: 192.168.200.153
tasks:
- name: create test1 for user
user:
name: test1
uid: 2000
state: present
[root@node1 ansible]# ansible-playbook syb.yml
PLAY [test1] *******************************************************************
TASK [Gathering Facts] *********************************************************
ok: [192.168.200.153]
TASK [create test1 for user] ***************************************************
ok: [192.168.200.153]
PLAY RECAP *********************************************************************
192.168.200.153 : ok=2 changed=0 unreachable=0 failed=0 skipped=0 rescued=0 ignored=0
11. 模块文档
Ansible随附打包的大量模块为管理员提供了许多用于常见管理任务的工具。前面我们介绍了Ansible官方网站的帮助文档链接https://docs.ansible.com/。通过模块索引,可以很轻松的找到对应的模块。例如,适用于用户和服务管理的模块可以在Systems Modules下找到,而适合数据库管理的模块则可在Database Modules下找到。
对于每一个模块,Ansible官网提供了其功能摘要,以及关于如何通过模块的选项来调用各项具体功能的说明。文档还提供了实用的示例,演示各个模块的用法,以及任务中关键字的设置方法。
前面我们用到过ansible-doc -l命令。这将显示模块名称列表以及其功能的概要。
[root@node1 ansible]# ansible-doc -l
a10_server Manage A1>
a10_server_axapi3 Manage A1>
a10_service_group Manage A1>
a10_virtual_server Manage A1>
aci_aaa_user Manage AA>
aci_aaa_user_certificate Manage AA>
aci_access_port_block_to_access_port Manage po>
aci_access_port_to_interface_policy_leaf_profile Manage Fa>
aci_access_sub_port_block_to_access_port Manage su>
aci_aep Manage at>
......省略
使用ansible-doc [module name]命令来显示模块的详细文档。与Ansible官网一样,该命令提供模块功能的概要、其不同选项的详细信息,以及示例。
[root@node1 ansible]# ansible-doc yum //显示yum模块的帮助文档
> YUM (/usr/lib/python3.6/site-packages/ansible/modules/packaging/os>
Installs, upgrade, downgrades, removes, and lists packages and
groups with the `yum' package manager. This module only works
on Python 2. If you require Python 3 support see the [dnf]
module.
* This module is maintained by The Ansible Core Team
* note: This module has a corresponding action plugin.
OPTIONS (= is mandatory):
- allow_downgrade
Specify if the named package and version is allowed to
downgrade a maybe already installed higher version of that
package. Note that setting allow_downgrade=True can make this
module behave in a non-idempotent way. The task could end up
with a set of packages that does not match the complete list
of specified packages to install (because dependencies between
the downgraded package and others can cause changes to the
packages which were in the earlier transaction).
[Default: no]
type: bool
version_added: 2.4
ansible-doc命令还提供-s选项,它会生成示例输出,可以充当如何在playbook在使用特定模块的示范。此输出可以作为起步模板,包含在实施该模块以执行任务的playbook中。输出中包含的注释,提醒管理员各个选项的用法。下例演示了yum模块的这种输出:
[root@node1 ansible]# ansible-doc -s yum
- name: Manages packages with the `yum' package manager
yum:
allow_downgrade: # Specify if the named package and version>
allowed to
downgrade a maybe
already installed
higher version of
that package.
Note that setting
allow_downgrade=T
rue can make this
module behave in
a non-idempotent
way. The task
could end up with
a set of packages
that does not
match the
complete list of
specified
packages to
install (because
dependencies
between the
downgraded
使用ansible-doc命令可以查找和了解如何使用模块。尽管command、shell和raw模块的用法可能看似简单,但在可能时,应尽量避免在playbook中使用它们因为它们可以取胜任意命令,因此使用这些模块时很容易写出非幂等的playbook。
例如,以下使用shell模块的任务为非幂等。每次运行play时,它都会重写/etc/resolv.conf,即使它已经包含了行nameserver 192.168.200.153。
- name: Non-idepotent approach with shell module
shell: echo "nameserver 192.168.200.153" > /etc/resolv.conf
可以通过多种方式编写以幂等方式使用shell模块的任务,而且有时候进行这些更改并使用shell是最佳的做法。但更快的方案或许是使用ansible-doc发现copy模块,再使用它获得所需的效果。
在以下示例中,如果/etc/resolv.conf文件已包含正确的内容,则不会重写该文件:
- name: Idempotent approach with copy module
copy:
dest: /etc/resolv.conf
content: "nameserver 192.168.200.153\n"
copy模块可以测试来了解是否达到了需要的状态,如果已达到,则不进行任何更改。shell模块容许非常大的灵活性,但需要格外小心,从而确保它以幂等方式运行。
幂等的playbook可以重复运行,确保系统处于特定的状态,而不会破坏状态已经正确的系统。
12. Playbook语法变化
YAML注释
注释也可以用于提高可读性。在YAML中,编号或井号字符(#)右侧的所有内容都是注释。如果注释的左侧有内容,请在该编号符号的前面加一个空格。
# This is a YAML comment
some data # This is also a YAML comment
YAML字符串
YAML中的字符串通常不需要放在引号里,即使字符串中包含空格。字符串可以用双引号或单引号括起。
this is a string
'this is another string'
"this is yet another a string"
编写多行字符串有两种方式。可以使用管道符表示要保留字符串中的换行字符。
line: |
"192.168.200.153 node2"
"192.168.200.154 node3"
"192.168.200.155 node4"
要编写多行字符串,还可以使用大于号字符来表示换行字符转换成空格并且行内的引导空白将被删除。这种方法通常用于将很长的字符串在空格字符处断行,使它们跨占多行来提高可读性。
line: >
"192.168.200.153 node2"
"192.168.200.154 node3"
"192.168.200.155 node4"
YAML字典
下面是一个简单的字典形式
name: svcrole
svcservice: httpd
svcport: 80
字典也可以使用以大括号括起的内联块格式编写,如下所示:
{name: svcrole, svcservice: httpd, svcport: 80}
大多数情况下应避免内联块格式,因为其可读性较低。不过,至少有一种情形中会较常使用它。当playbook中包含角色列表时,较常使用这种语法,从而更加容易区分play中包含的角色和传递给角色的变量。
YAML列表
最简单的列表如下:
hosts:
- servera
- serverb
- serverc
列表也有以中括号括起的内联格式,如下所示:
hosts: [servera, serverb, serverc]
我们应该避免使用此语法,因为它通常更难阅读。
13. 过时的“键=值” playbook简写
某些playbook可能使用较旧的简写方法,通过将模块的键值对放在与模块名称相同的行上来定义任务。例如,你可能会看到这种语法:
tasks:
- name: shorthand form
service: name=httpd enabled=true state=started
通常我们应该将这样的语法编写为如下所示:
tasks:
- name: normal form
service:
name: httpd
enabled: true
state: started
通常我们应避免简写形式,而使用普通形式。
普通形式的行数较多,但更容易操作。任务的关键字垂直堆叠,更容易区分。阅读play时,眼睛直接向一扫视,左右运动较少。而且,普通语法是原生的YAML。
你可能会在文档和他人提供的旧playbook中看到这种语法,而且这种语法仍然可以发挥作用。
14. 运维发布的方式
蓝绿部署
首先,这是用于0 downtime应用上线时的一套部署策略。
其次,要知道蓝绿部署无需停机,不停止老版,额外搞一套新版本,等测试发现新版本OK后,删除老版本。
再次,说明下流量管理,在部署新版本之前,需要将部署新版本的流量掐断,全部打到ok的老版本上。
最后,点一下注意使用条件,需要有两倍的机器资源。
灰度发布(金丝雀发布)
不停止老版本,额外搞一套新版本,常常按照用户设置路由权重,例如90%的用户维持使用老版本,10%的用户尝鲜新版本。不同版本应用共存,经常与A/B测试一起使用,用于测试选择多种方案。
- 精确的流量分发控制
需要有确切的策略保证某特征用户访问新版本,某特征用户访问老版本。从产品角度看要做A/B test,必须控制测试样本。
- 做监控
运维: 错误率,吞吐量,延迟,cpu内存消耗
PM: pv, uv
3. 需要灵活发布应用
周期可能会持续很久,所以新旧版本会并存。同时,还有可能各个版本需要各自迭代。版本之间能够区分对应的监控日志信息。
滚动发布
一般是取出一个或者多个服务器停止服务,执行更新,并重新将其投入使用。周而复始,直到集群中所有的实例都更新成新版本。
比蓝绿部署节约资源,但是服务器节点数量多,会很慢。
部署过程简述:
发布一台金丝雀,主要做流量验证。
需要准备好发布工具和智能LB,平滑的版本替换和流量的拉入拉出。
每次发布先将老版本V1流量从LB移除,然后清楚老版本,发新版本V2,再将LB流量接入新版本。
一次滚动式发布一般由若干个发布批次组成,每批次发布数量可配置。并且每批次之间有时间间隔,所以导致滚动发布过程比较缓慢。
回退,发布的逆过程,所以一样缓慢。
红黑部署
这是Netflix采用的部署手段,Netflix的主要基础设施是在AWS上,所以它利用AWS的特性,在部署新的版本时,通过AutoScaling Group用包含新版本应用的AMI的LaunchConfiguration创建新的服务器。测试不通过,找到问题原因后,直接干掉新生成的服务器以及Autoscaling Group就可以,测试通过,则将ELB指向新的服务器集群,然后销毁掉旧的服务器集群以及AutoScaling Group。
红黑部署的好处是服务始终在线,同时采用不可变部署的方式,也不像蓝绿部署一样得保持冗余的服务始终在线。
需要注意: 在蓝绿色部署中,两个版本可能暂时同时获取请求,而在红黑中,只有一个版本在任何时间点获得流量。