一、简介

  Ansible是与puppet、saltstack类似的集群管理工具,其优点是仅需要ssh和Python即可使用,而不像puppet、saltstack那样都需要客户端。puppet与saltstack这2个软件都需要安装客户端,而saltstack与ansible很相似,都是属于python流的,但saltstack不是很稳定;puppet虽然稳定,但命令执行的时候,需要配置模块儿,非常麻烦,而且还需要安装客户端,学习成本高。ansible在性能方面并不弱于这两个工具,而且使用还并不繁琐,关键ansible是基于paramiko 开发的,paramiko是一个纯Python实现的ssh协议库。ansible不需要在远程主机上安装client/agents,因为它是基于ssh来和远程主机通讯的。

其他特性:

ansible提供两种方式去完成任务,一是 ad-hoc 命令,一是写 Ansible playbook。前者可以解决一些简单的任务, 后者解决较复杂的任务。

它基于模块工作,可使用任意语言开发模块;

使用yaml语言定制剧本playbook;

一般而言,在学习了 playbooks 之后,你才能体会到 Ansible 真正的强大之处在哪里。

二、安装

  可以从github上安装,也可以用系统yum或apt源里安装,或者pip安装。方便起见,直接pip安装即可。

已ubuntu为例:


#apt-get install python-pip

#pip install ansible

三、基本使用

(1)ansible应用程序的主配置文件:/etc/ansible/ansible.cfg

需要注意的是,与远端节点交流是通过并行的机制,并行机制的方式可以通过传递 ``–orks``参数设置,或者在配置文件里面编辑。默认是5个线程,比较保守,如果你有足够的内存,可以设置为更大值。


[defaults]

 

# some basic default values...

 

#inventory      = /etc/ansible/hosts

#library        = /usr/share/my_modules/

#remote_tmp     = $HOME/.ansible/tmp

#forks          = 5

forks          = 100

#poll_interval  = 15

#sudo_user      = root

#ask_sudo_pass = True

#ask_pass      = True

#transport      = smart

#remote_port    = 22

#module_lang    = C

(2) Host Inventory定义管控主机:/etc/ansible/hosts

/etc/ansible/hosts 文件的格式与windows的ini配置文件类似:


10.13.25.3

 

badwolf.example.com:5309

 

[dbservers]

one.example.com

two.example.com

three.example.com

 

[webservers]

www[01:50].example.com

 

[databases]

db-[a:f].example.com

 其中:

单个主机一般放在server组的上面,可以用IP和域名;

方括号[]中是组名,用于对系统进行分类,便于对不同系统进行个别的管理;

如果有主机的SSH端口不是标准的22端口,可在主机名之后加上端口号,用冒号分隔。SSH 配置文件中列     出的端口号不会在 paramiko 连接中使用,会在 openssh 连接中使用。

一组相似的 hostname , 可简写

(3) 

ad-hoc命令:

ansible有许多模块,默认是 ‘command’,也就是命令模块,我们可以通过 -m 选项来指定不同的模块; -a 选项,指定模块 arguments

常用的模块:copy、command、service、yum、apt、file、raw、shell、script、cron、user、state、template、

E.g.


#ping 测试

$sudo ansible all -m ping

 

#管理软件包

#安装

$ansible webservers -m apt -a "name=lrzsz state=present"

#卸载

$ansible webservers -m apt -a "name=lrzsz state=absent"

 

#启动服务

$ansible webservers -m service -a "name=httpd state=started"

#停止服务

$ ansible webservers -m service -a "name=httpd state=stopped"

wKiom1cl75bATTE8AAA5V-cnN1Q691.png

四、Ansible playbooks

  Playbooks 是 Ansible的配置,部署,编排语言.他们可以被描述为一个需要希望远程主机执行命令的方案,或者一组IT程序运行的命令集合。实际playbook就是一个用yaml语法把多个模块堆起来的一个文件。

1、其中,YAML 有一个小的怪癖,所有的 YAML 文件(无论和 Ansible 有没有关系)开始行都应该是 ---. 这是 YAML 格式的一部分, 表明一个文件的开始.

列表中的所有成员都开始于相同的缩进级别, 并且使用一个 "- " 作为开头(一个横杠和一个空格):

示例yml,安装http的yml:


---

- hosts: webservers

  vars:

    http_port: 80

    max_clients: 200

  remote_user: root

  tasks:

  - name: ensure apache is at the latest version

    yum: pkg=httpd state=latest

  - name: write the apache config file

    template: src=/srv/httpd.j2 dest=/etc/httpd.conf

    notify:

    - restart apache

  - name: ensure apache is running

    service: name=httpd state=started

  handlers:

    - name: restart apache

      service: name=httpd state=restarted

2、测试playbook,在openstack_test组里的主机上安装lftp,之后卸载lftp,最后启动mysql。

yml文件如下:

wKioL1cl8xOh_u0oAAA87gyu8F4782.png

运行截图,TASK,启动mysql显示FAILED,是因为这四台server上没有安装mysql软件,这里测试看下执行情况:

wKiom1cl8kPhubNoAAF4LPzNlAw555.png

注意的一点,在运行 playbook 时(从上到下执行),如果一个 host 执行 task 失败,这个 host 将会从整个 playbook 的 rotation 中移除. 如果发生执行失败的情况,请修正 playbook 中的错误,然后重新执行即可.

3、单独说下roles

roles用于实现“代码复用”。

roles只是把任务给分离出去了。只要在playbook文件中调用此role就可执行这些任务。

如我们定义了一个很复杂的任务,但是要用在另外的主机组或只想用于单台主机的时候就要修改这个文件,总修改也不是办法。 可以复制多份,但有时候也不够灵活。 

所以就可以用role把任务主体分离出来,只在playbook中写一些额外的东西,如变量,主机等等。

roles以特定的层次型格式组织起来playbook中的各主元素(vars, tasks, handlers)。每一个主元素都以一个目录来表示。

各目录如下:

files:此角色中用到的所有文件均放置于此目录中; 对应于copy模块。

templates:Jinja2模板文件存放位置;  对应于template模块。

tasks:任务列表文件;里面可以有多个文件,但至少有一个叫做main的文件;

handlers:处理器列表文件;里面可以有多个文件,但至少有一个叫做main的文件;

vars:变量字典文件;里面可以有多个文件,但至少有一个叫做main的文件;

meta:此角色的特殊设定及依赖关系;

Handlers 也是一些 task 的列表,通过名字来引用,它们和一般的 task 并没有什么区别.Handlers 是由通知者进行 notify, 如果没有被 notify,handlers 不会执行.不管有多少个通知者进行了 notify,等到 play 中的所有 task 执行完成之后,handlers 也只会被执行一次.

这里是一个 handlers 的示例:


handlers:

    - name: restart memcached

      service:  name=memcached state=restarted

    - name: restart apache

      service: name=apache state=restarted

Handlers 最佳的应用场景是用来重启服务,或者触发系统重启操作.除此以外很少用到了.

roles是非常伟大的产品,所以当我们写 playbooks 时官方推荐使用 roles。

下面是用playbook一键安装LAMP环境的示例,可参考其规范写ansible的playbook:

https://github.com/ansible/ansible-examples/tree/master/lamp_simple

附上ansible的中文翻译文档连接,建议参照英文的官方文档一起学习:

http://www.ansible.com.cn/



在学习批量管理软件时,首先要明确的知道自己需要什么,网上大神很多,他们都研究到源码上了,写了很多介绍绚丽功能的文档,但其实那些功能基本上我们都用不到,经常被各种文档弄得头脑发晕,此文就是为了简单直白的告诉大家ansible的功能,满足大家的基本需要。

首先确认批量管理我们需要什么:无外乎主机分组管理、实时批量执行命令或脚本、实时批量分发文件或目录、定时同步文件等。

 

1.     ansiblesaltstack对比

前一段时间用了saltstack,免不得要谈一下他们的优缺点。两者都是安装和使用都非常方便的批量管理软件。

1、salt要安装agent;ansible不需要,通过ssh连接,省掉装agent的事。

2、salt在server端要启进程;ansible不需要,但这都无所谓差不多。

3、salt与ansible都有模块,可使用任意语言开发模块。

4、salt与ansible都使用yaml语言格式编写剧本。

 

ansible由于走的是ssh,所以它有认证的过程,以及加密码的过程,这使得ansible非常慢,不适用于大规模环境(指上千台)。

saltstack详细介绍参考我的博文:http://yangrong.blog.51cto.com/6945369/1556712

 

为什么我放弃salt呢,首先服务器不多(百台左右),其次,salt的master端与minion端TCP连接经常断开,导致有时执行命令时会漏机器,这简直让我忍无可忍。听说最新版的salt好了很多,但由于公司系统是定制的,安装软件特别麻烦(15M的系统,解决依赖就是个大问题),我还是选择了ansible。

 

2.     ansible安装

yum install paramiko PyYAMLjinja2 httplib2   #ansible所需依赖包

git clone https://github.com/ansible/ansible.git

cd ansible

python setup.py install

cp ansible/examples/ansible.cfg/etc/ansible/   #拷贝ansible默认的配置文件,也可不拷贝。

 

另一个安装方法:

pip install ansible


在开始ansible操作受控机器前,需要配置好ssh免密码登陆

 

3.     ansible命令参数介绍

Ansible中的临时命令的执行是通过Ad-Hoc来完成,能够快速执行,而且不需要保存执行的命令,例如:

ansible -i ~/hosts all -m command -a ‘who’ -u root

主要参数如下:

-u username          指定ssh连接的用户名,即执行后面命令的用户

-i inventory_file    指定所使用的inventory文件的位置,默认为/etc/ansible/hosts

-m module            指定使用的模块,默认为command

-f 10                指定并发数,并发量大的时候,提高该值

--sudo [-k]          当需要root权限执行的化,-k参数用来输入root密码

 

4.     ansible主机分组管理:

配置好ssh免密码登陆后,就该把那些机器加入到hosts文件中,hosts不限路径,可用-i参数指定路径。

[root@yang ~]# cat  /etc/ansible/hosts

[KD1]    #组名

1.1.1.1:62222    #主机,此处对于端口进行指定,毕竟有些服务器ssh端口打开的不一样。

1.1.1.2:62222

[KD2]

1.1.1.3:62222

1.1.1.4:62222

 

分组执行效果:

[root@yang ~]#ansible -i /etc/ansible/hosts KD1 -m shell -a  'uptime'

1.1.1.1 | success |rc=0 >>

 11:56:31 up 2 days, 17:42, load average: 0.41,0.34, 0.32

 

1.1.1.2 | success |rc=0 >>

 11:57:03 up 2 days, 17:44, load average: 0.34,0.28, 0.25

 

连续的主机名使用";"号分隔,如:ansible -i /etc/ansible/hosts  'KD1;1.1.1.3' -m shell -a 'uptime'

 

更多的分组格式参考:

http://www.ibm.com/developerworks/cn/linux/1407_liheng_ansible/

 

还可以使用脚本动态获取主机的方式:

官方地址:http://docs.ansible.com/intro_dynamic_inventory.html

网络文档:http://noops.me/?p=1446

 

5.     ansible实时批量执行命令和脚本:

批量执行命令:

ansible -i/etc/ansible/hosts all -m shell -a 'uptime'

ansible -i/etc/ansible/hosts all -m command -a 'uptime'

#shell模块可以使用管道,而command则不可以。

 

批量执行脚本:

ansible all -m script    -a "/root/123.sh"   #此命令是在远程服务器上执行本地的脚本

网上文档说,复杂的命令用playbook管理,我实在不认同,作为运维人员,我写一个脚本多简单,干嘛去花太多时间研究playbook的格式与用法呢?

再说,ansible对于一些安装包的管理,我可以事先做好rpm包,然后使用copy模块分发过去就是,为什么去研究太多的用法?

 

6.     ansible实时批量拷贝文件或目录

ansible-doc copy中的帮助信息得知,ansiblecopy模块是围绕rsync的包装,所以它是增量而不是全量的拷贝。

ansible MachineName   -m copy -a 'src=/etc/fstab dest=/tmp/fstab mode=644 owner=root'  #拷贝文件

ansible MachineName   -m copy -a 'src=/etc/test dest=/root/test mode=755 owner=root '  #此处test为目录

 

7.     ansible定时同步文件

既然ansiblecopy模块是rsync的包装,那我定期执行copy目录的命令,就能完成文件的定时同步了。如果文件变化,就会同步过去,如果没变化,就不会拷贝。以后只要把要同步的文件放到该目录下即可。

 

8.     ansible模块帮助

执行命令用到的那些模块是干嘛的?使用ansible-doc查看帮助吧。

ansible-doc -l       #查看模块列表

ansible-doc  copy    #查看copy模块的详细信息

ansible-doc  script #查看script模块的详细信息

常用的模块有ping,copy,shell,command,script等。更多模块的使用请自行探索吧,我比较懒,满足我的需求后就不想动脑了。

 

9.     ansibleplaybook的使用

其实playbook就是把上述在命令行的操作,以yml格式写在文件中来执行而已。复杂的playbook只是更多的命令行操作的集合。

此例:当某个文件变化后,移走该文件。

#cat  playbook.yml

---

- hosts: local  # hosts中指定

  remote_user: yang  # 如果和当前用户一样,则无需指定

  tasks:

      - name: whoami

        copy: src=~/hosts dest=~/hosts.dest  #  本地拷贝到远端

        notify: # 如果copy执行完之后~/hosts.dest文件发送了变化,则执行

            - clear copy  # 调用handler中的clear copy定义的动作

  handlers:

      - name: clear copy

        shell: 'mv ~/hosts.dest hosts.del'  # 假装删除

 

注解:

tasks定义了playbook中要执行的任务,包括任务名name以及具体的任务内容

notify:类似于Salt的require,表示当前面的任务完成后且有相应的变化时调用后面定义的handler

handlers:与notify结合使用,被调用的handler的具体定义

 

playbook执行方法:

ansible-playbook playbook.yml    #主机名、执行命令都已在yml中指定了。