自动化运维工具Ansible详细部署

==========================================================================================

一、基础介绍

==========================================================================================

1、简介

ansible是新出现的自动化运维工具,基于Python开发,集合了众多运维工具(puppetcfenginecheffuncfabric)的优点,实现了批量系统配置、批量程序部署、批量运行命令等功能。ansible是基于模块工作的,本身没有批量部署的能力。真正具有批量部署的是ansible所运行的模块,ansible只是提供一种框架。主要包括:

(1)、连接插件connection plugins:负责和被监控端实现通信;

(2)host inventory:指定操作的主机,是一个配置文件里面定义监控的主机;

(3)、各种模块核心模块、command模块、自定义模块;

(4)、借助于插件完成记录日志邮件等功能;

(5)playbook:剧本执行多个任务时,非必需可以让节点一次性运行多个任务。


2、总体架构

wKiom1Rsxz3ToUCAAAGROYAM3EI989.jpg


3、特性

(1)no agents:不需要在被管控主机上安装任何客户端;

(2)no server:无服务器端,使用时直接运行命令即可;

(3)modules in any languages:基于模块工作,可使用任意语言开发模块;

(4)yamlnot code:使用yaml语言定制剧本playbook

(5)ssh by default:基于SSH工作;

(6)strong multi-tier solution:可实现多级指挥。


4、优点
(1)
、轻量级,无需在客户端安装agent,更新时,只需在操作机上进行一次更新即可;
(2)
、批量任务执行可以写成脚本,而且不用分发到远程就可以执行;
(3)
、使用python编写,维护更简单,ruby语法过于复杂;
(4)
、支持sudo


5、任务执行流程

wKiom1Rsx2uQYJZ5AAJplY08vOQ976.jpg


说明:

(1)、以上内容大多是基于他人分享的基础上总结而来,学习借鉴之用;

(2)、本次安装基于 CentOS 6.4 系统环境。


==========================================================================================

二、Ansible基础安装与配置

==========================================================================================

1Ansible基础安装

(1)python2.7安装

https://www.python.org/ftp/python/2.7.8/Python-2.7.8.tgz

# tar xvzf Python-2.7.8.tgz

# cd Python-2.7.8

# ./configure --prefix=/usr/local

# make --jobs=`grep processor/proc/cpuinfo | wc -l`

# make install


## python头文件拷贝到标准目录,以避免编译ansible时,找不到所需的头文件

# cd /usr/local/include/python2.7

# cp -a ./* /usr/local/include/


## 备份旧版本的python,并符号链接新版本的python

# cd /usr/bin

# mv python python2.6

# ln -s /usr/local/bin/python


## 修改yum脚本,使其指向旧版本的python,已避免其无法运行

# vim /usr/bin/yum

#!/usr/bin/python  -->  #!/usr/bin/python2.6


(2)setuptools模块安装

https://pypi.python.org/packages/source/s/setuptools/setuptools-7.0.tar.gz

# tar xvzf setuptools-7.0.tar.gz

# cd setuptools-7.0

# python setup.py install


(3)pycrypto模块安装

https://pypi.python.org/packages/source/p/pycrypto/pycrypto-2.6.1.tar.gz

# tar xvzf pycrypto-2.6.1.tar.gz

# cd pycrypto-2.6.1

# python setup.py install


(4)PyYAML模块安装

http://pyyaml.org/download/libyaml/yaml-0.1.5.tar.gz

# tar xvzf yaml-0.1.5.tar.gz

# cd yaml-0.1.5

# ./configure --prefix=/usr/local

# make --jobs=`grep processor/proc/cpuinfo | wc -l`

# make install


https://pypi.python.org/packages/source/P/PyYAML/PyYAML-3.11.tar.gz

# tar xvzf PyYAML-3.11.tar.gz

# cd PyYAML-3.11

# python setup.py install


(5)Jinja2模块安装

https://pypi.python.org/packages/source/M/MarkupSafe/MarkupSafe-0.9.3.tar.gz

# tar xvzf MarkupSafe-0.9.3.tar.gz

# cd MarkupSafe-0.9.3

# python setup.py install


https://pypi.python.org/packages/source/J/Jinja2/Jinja2-2.7.3.tar.gz

# tar xvzf Jinja2-2.7.3.tar.gz

# cd Jinja2-2.7.3

# python setup.py install


(6)paramiko模块安装

https://pypi.python.org/packages/source/e/ecdsa/ecdsa-0.11.tar.gz

# tar xvzf ecdsa-0.11.tar.gz

# cd ecdsa-0.11

# python setup.py install


https://pypi.python.org/packages/source/p/paramiko/paramiko-1.15.1.tar.gz

# tar xvzf paramiko-1.15.1.tar.gz

# cd paramiko-1.15.1

# python setup.py install


(7)simplejson模块安装

https://pypi.python.org/packages/source/s/simplejson/simplejson-3.6.5.tar.gz

# tar xvzf simplejson-3.6.5.tar.gz

# cd simplejson-3.6.5

# python setup.py install


(8)ansible安装

https://github.com/ansible/ansible/archive/v1.7.2.tar.gz

# tar xvzf ansible-1.7.2.tar.gz

# cd ansible-1.7.2

# python setup.py install


2Ansible配置

(1)SSH免密钥登录设置

## 生成公钥/私钥

# ssh-keygen -t rsa -P ''

wKioL1RsyCTC94M0AACbRu5nOSQ166.jpg


## 写入信任文件(将/root/.ssh/id_rsa_storm1.pub分发到其他服务器,并在所有服务器上执行如下指令):

# cat /root/.ssh/id_rsa_storm1.pub >> /root/.ssh/authorized_keys

# chmod 600 /root/.ssh/authorized_keys


(2)ansible配置

# mkdir -p /etc/ansible

# vim /etc/ansible/ansible.cfg

……

remote_port = 36000

private_key_file = /root/.ssh/id_rsa_storm1

……


## 主机组定义

# vim /etc/ansible/hosts

[storm_cluster]

10.223.55.100

10.223.55.101

10.223.38.226

10.223.38.227

10.223.39.216

10.223.25.123


(3)、简单测试

# ansible storm_cluster -m command -a 'uptime'

wKiom1Rsx-bQ_7jKAADLJtl0-4A979.jpg

说明:第一次运行时,需要输入一下“yes”【进行公钥验证】,后续无需再次输入。


## 再次运行

# ansible storm_cluster -m command -a 'uptime'

wKioL1RsyHrwytdgAAHAHOcTZR8008.jpg


3、常用模块使用

(1)setup

## 用来查看远程主机的一些基本信息

# ansible storm_cluster -m setup

wKioL1RsyJyAptQMAAFxh3ywaEs209.jpg


(2)ping

## 用来测试远程主机的运行状态

# ansible storm_cluster -m ping

wKiom1RsyEPSQolOAAGGdiXrB3c688.jpg


(3)file

## 设置文件的属性

相关选项如下:

force:需要在两种情况下强制创建软链接,一种是源文件不存在,但之后会建立的情况下;另一种是目标软链接已存在,需要先取消之前的软链,然后创建新的软链,有两个选项:yes|no

group:定义文件/目录的属组

mode:定义文件/目录的权限

owner:定义文件/目录的属主

path:必选项,定义文件/目录的路径

recurse:递归设置文件的属性,只对目录有效

src:被链接的源文件路径,只应用于state=link的情况

dest:被链接到的路径,只应用于state=link的情况

state

       directory:如果目录不存在,就创建目录

       file:即使文件不存在,也不会被创建

       link:创建软链接

       hard:创建硬链接

       touch:如果文件不存在,则会创建一个新的文件,如果文件或目录已存在,则更新其最后修改时间

       absent:删除目录、文件或者取消链接文件


示例:

## 远程文件符号链接创建

# ansible storm_cluster -m file -a "src=/etc/resolv.conf dest=/tmp/resolv.conf state=link"

wKioL1RsyNyyhjnQAAC-cHXrNCg654.jpg


## 远程文件信息查看

# ansible storm_cluster -m command -a "ls –al /tmp/resolv.conf"

wKiom1RsyH6j2C39AAFtr8zKvT4777.jpg


## 远程文件符号链接删除

# ansible storm_cluster -m file -a "path=/tmp/resolv.conf state=absent"

wKioL1RsyRLAj0RMAADL23Ztiio670.jpg


## 远程文件信息查看

# ansible storm_cluster -m command -a "ls -al /tmp/resolv.conf"

wKiom1RsyLXR7deZAAEhGk-nuao742.jpg

说明:如上显示,代表文件或链接已经删除。


(4)copy

## 复制文件到远程主机

相关选项如下:

backup:在覆盖之前,将源文件备份,备份文件包含时间信息。有两个选项:yes|no

content:用于替代“src”,可以直接设定指定文件的值

dest:必选项。要将源文件复制到的远程主机的绝对路径,如果源文件是一个目录,那么该路径也必须是个目录

directory_mode:递归设定目录的权限,默认为系统默认权限

force:如果目标主机包含该文件,但内容不同,如果设置为yes,则强制覆盖,如果为no,则只有当目标主机的目标位置不存在该文件时,才复制。默认为yes

others:所有的file模块里的选项都可以在这里使用

src:被复制到远程主机的本地文件,可以是绝对路径,也可以是相对路径。如果路径是一个目录,它将递归复制。在这种情况下,如果路径使用“/”来结尾,则只复制目录里的内容,如果没有使用“/”来结尾,则包含目录在内的整个内容全部复制,类似于rsync


示例:

## 将本地文件“/etc/ansible/ansible.cfg”复制到远程服务器

# ansible storm_cluster -m copy -a "src=/etc/ansible/ansible.cfg dest=/tmp/ansible.cfg owner=root group=root mode=0644"

wKiom1RsyNaiKBOrAADvYmNkJhY434.jpg


## 远程文件信息查看

# ansible storm_cluster -m command -a "ls -al /tmp/ansible.cfg"

wKiom1RsyO_SkZtSAAE1LmxVNxk291.jpg


(5)command

## 在远程主机上执行命令

相关选项如下:

creates:一个文件名,当该文件存在,则该命令不执行

free_form:要执行的linux指令

chdir:在执行指令之前,先切换到该目录

removes:一个文件名,当该文件不存在,则该选项不执行

executable:切换shell来执行指令,该执行路径必须是一个绝对路径


示例:

# ansible storm_cluster -m command -a "uptime"

wKioL1RsyYOjbttbAAG9mMpCf1s600.jpg


(6)shell

## 切换到某个shell执行指定的指令,参数与command相同。

command不同的是,此模块可以支持命令管道,同时还有另一个模块也具备此功能:raw


示例:

## 先在本地创建一个SHELL脚本

# vim /tmp/rocketzhang_test.sh

#!/bin/sh

date +%F_%H:%M:%S


#chmod +x /tmp/rocketzhang_test.sh


## 将创建的脚本文件分发到远程

# ansible storm_cluster -m copy -a "src=/tmp/rocketzhang_test.sh dest=/tmp/rocketzhang_test.sh owner=root group=root mode=0755"


## 远程执行

# ansible storm_cluster -m shell -a "/tmp/rocketzhang_test.sh"

wKioL1RsyaPQliwdAAD4ONP1kro483.jpg


(7)、更多模块

其他常用模块,比如:servicecronyumsynchronize就不一一例举,可以结合自身的系统环境进行测试。

service:系统服务管理

cron:计划任务管理

yumyum软件包安装管理

synchronize:使用rsync同步文件

user:系统用户管理

group:系统用户组管理


更多模块可以参考:

#ansible-doc –l

wKiom1RsyU6z1a-EAAK0vQQ--mg925.jpg


http://docs.ansible.com/modules_by_category.html

http://www.ansible.cn/docs/

(国内的一个镜像站点,避免被墙 ^_^ )


(8)、一些概念补充

playbook的组成:playbook是由一个或多个“play”组成的列表,可以让它们联同起来按事先编排的机制执行;所谓task无非是调用ansible的一个module,而在模块参数中可以使用变量;模块执行是幂等的,这意味着多次执行是安全的,因为其结果均一致;


执行模型task list中的各任务按次序逐个在hosts中指定的所有主机上执行,即在所有主机上完成第一个任务后再开始第二个。在顺序运行某playbook时,如果中途发生错误,所有已执行任务都将回滚,因此,在修改playbook后重新执行一次即可;


task组成:每个task都应该有其name,用于playbook的执行结果输出,建议其内容尽可能清晰地描述任务执行步骤。如果未提供name,则action的结果将用于输出;


notify指定handler的执行机制:“notify”这个action可用于在每个play的最后被触发,在notify中列出的操作称为handler,仅在所有的变化发生完成后一次性地执行指定操作。


==========================================================================================

三、后续工作

==========================================================================================

1、深入学习ansibleplaybook以及扩展模块;

2、 结合业务环境,初步实现基础监控,以取代目前调用自动化部署平台API的方式;

3、 尝试自动化运维工具saltstack,并将其与ansible进行对比。


一些学习资料:

http://blog.xiaorui.cc/category/ansible/

http://lixcto.blog.51cto.com/4834175/d-4

https://github.com/ansible/ansible-examples

http://rfyiamcool.blog.51cto.com/1030776/d-51

http://dl528888.blog.51cto.com/2382721/d-4/p-1

http://edu.51cto.com/course/course_id-2220.html

http://edu.51cto.com/course/course_id-2032.html

http://www.shencan.net/index.php/category/%e8%87%aa%e5%8a%a8%e5%8c%96%e8%bf%90%e7%bb%b4/ansible/


结合Ansible技术监控Storm集群
2014-11-20 01:13:46
标签: storm  ansible
原创作品,允许转载,转载时请务必以超链接形式标明文章  原始出处 、作者信息和本声明。否则将追究法律责任。 http://sofar.blog.51cto.com/353572/1579897

1、我的hosts配置

vim /etc/hosts

1
2
3
4
5
6
7
8
9
10
11
12
192.168.1.100  storm_zk1
192.168.1.101  storm_zk2
192.168.1.102  storm_zk3
  
192.168.1.103  storm_nimbus
  
192.168.1.104  storm_supervisor1
192.168.1.105  storm_supervisor2
192.168.1.106  storm_supervisor3
192.168.1.107  storm_supervisor4
192.168.1.108  storm_supervisor5
192.168.1.109  storm_supervisor6

2、我的storm配置

vim /usr/local/storm/conf/storm.yaml

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
drpc.servers:
   - "storm_supervisor1"
   - "storm_supervisor2"
   - "storm_supervisor3"
   
storm.zookeeper.servers:
   - "storm_zk1"
   - "storm_zk2"
   - "storm_zk3"
   
storm.local.dir: "/data/storm/workdir"
  
nimbus.host: "storm_nimbus"
nimbus.thrift.port: 6627
nimbus.thrift.max_buffer_size: 1048576
nimbus.childopts: "-Xmx1024m"
nimbus.task.timeout.secs: 30
nimbus.supervisor.timeout.secs: 60
nimbus.monitor.freq.secs: 10
nimbus.cleanup.inbox.freq.secs: 600
nimbus.inbox.jar.expiration.secs: 3600
nimbus.task.launch.secs: 240
nimbus.reassign: true
nimbus.file.copy.expiration.secs: 600
nimbus.topology.validator: "backtype.storm.nimbus.DefaultTopologyValidator"
  
storm.zookeeper.port: 2181
storm.zookeeper.root: "/data/storm/zkinfo"
storm.cluster.mode: "distributed"
storm.local.mode.zmq: false
  
ui.port: 8080
ui.childopts: "-Xmx768m"
  
supervisor.slots.ports:
   - 6700
   - 6701
   - 6702
   - 6703
   - 6704
   - 6705
   - 6706
   - 6707
   - 6708
   - 6709
   
supervisor.childopts: "-Xmx2048m"
supervisor.worker.start.timeout.secs: 240
supervisor.worker.timeout.secs: 30
supervisor.monitor.frequency.secs: 3
supervisor.heartbeat.frequency.secs: 5
supervisor.enable: true
  
worker.childopts: "-Xmx4096m"
topology.max.spout.pending: 5000
  
storm.zookeeper.session.timeout: 5000
storm.zookeeper.connection.timeout: 3000
storm.zookeeper.retry.times: 6
storm.zookeeper.retry.interval: 2000
storm.zookeeper.retry.intervalceiling.millis: 30000
  
storm.thrift.transport: "backtype.storm.security.auth.SimpleTransportPlugin"
storm.messaging.transport: "backtype.storm.messaging.netty.Context"
storm.messaging.netty.server_worker_threads: 50
storm.messaging.netty.client_worker_threads: 50
storm.messaging.netty.buffer_size: 20971520
storm.messaging.netty.max_retries: 100
storm.messaging.netty.max_wait_ms: 1000
storm.messaging.netty.min_wait_ms: 100

3、nimbus节点部署

vim /data/scripts/monitor_status_for_storm.sh

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
#!/bin/sh
PATH= /sbin : /bin : /usr/sbin : /usr/bin : /usr/local/bin : /usr/local/sbin
  
/etc/profile
  
## 监控页面地址参数
MON_SRV_IPADDR= "192.168.1.103"
MON_SRV_PORT= "8080"
  
## 是否已正确扫描
SCAN_FLAG=0
  
## 工作基路径
BASE_PATH= "/data/scripts"
  
## 异常 storm Supervisor 主机地址列表
FAIL_SUPERVISOR_LIST= "${BASE_PATH}/fail_supervisor.txt"
  
#---------------------------------------------------------------------------------------------------
## 重启storm的nimbus服务
function  restart_storm_nimbus_server() 
{
     [[ -n ` ps  aux |  grep  java |  grep  storm` ]] &&  kill  -9 ` ps  aux |  grep  java |  grep  storm |  awk  '{print $2}' `
     nohup  /usr/local/storm/bin/storm  nimbus > /dev/null  2>&1 &
     nohup  /usr/local/storm/bin/storm  ui > /dev/null  2>&1 &
      
     sleep  30
}
  
#---------------------------------------------------------------------------------------------------
## 1、检查监控页面是否正常【8080端口不通的情况】
for  ((i=0; i<3; i++));  do
     RETVAL=` /usr/bin/nmap  -n -sS -p ${MON_SRV_PORT} ${MON_SRV_IPADDR} |  grep  open `
     [[ -n  "${RETVAL}"  ]] && SCAN_FLAG=1; break  ||  sleep  10
done
  
[[ ${SCAN_FLAG} - ne  1 ]] && restart_storm_nimbus_server
  
#---------------------------------------------------------------------------------------------------
## 2、将监控页面抓取内容与本地hosts内容进行差异比较,以确定是否存在异常的 storm supervisor 服务
curl -s http: // ${MON_SRV_IPADDR}:${MON_SRV_PORT}/ |  sed  's/<td>/<td>\n/g'  awk  -F  '<'  '/^storm_/{print $1}'  awk  '!/nimbus/{print}'  sort  > ${BASE_PATH} /supervisor_list_from_page .txt
  
## 如果获取的storm nimbus监控页面数据为空,代表storm nimbus服务存在异常
[[ -z ` sed  '/^$/d'  ${BASE_PATH} /supervisor_list_from_page .txt` ]] && restart_storm_nimbus_server
  
sort  -nr ${BASE_PATH} /supervisor_list_from_page .txt ${BASE_PATH} /supervisor_list .txt |  uniq  -u > ${BASE_PATH} /supervisor_list_for_failed .txt
[[ -z ` sed  '/^$/d'  ${BASE_PATH} /supervisor_list_for_failed .txt` ]] &&  rm  -f ${BASE_PATH} /supervisor_list_for_failed .txt &&  exit  0
  
#---------------------------------------------------------------------------------------------------
## 3、获得异常的 storm supervisor 服务的IP地址列表
echo  "[fail_supervisor]"  >> ${FAIL_SUPERVISOR_LIST}
  
for  SUPERVISOR_NAMEADDR  in  ` cat  ${BASE_PATH} /supervisor_list_for_failed .txt`
do
     TEMP_IPADDR=` grep  -w ${SUPERVISOR_NAMEADDR}  /etc/hosts  grep  - v  '#'  awk  '{print $1}'  tail  -1`
     echo  "${TEMP_IPADDR}"  >> ${FAIL_SUPERVISOR_LIST}
     IPLIST= "${IPLIST} ${TEMP_IPADDR}"
done
  
#---------------------------------------------------------------------------------------------------
## 4、远程重启 storm supervisor 服务
/usr/local/bin/ansible  -i ${FAIL_SUPERVISOR_LIST} fail_supervisor -m shell -a  "/data/scripts/restart_storm_service.sh"
rm  -f ${FAIL_SUPERVISOR_LIST}

vim /data/scripts/supervisor_list.txt

1
2
3
4
5
6
storm_supervisor1
storm_supervisor2
storm_supervisor3
storm_supervisor4
storm_supervisor5
storm_supervisor6

# touch /var/run/check_storm.lock

# crontab -e

*/2 * * * * (flock --timeout=0 /var/run/check_storm.lock /data/scripts/monitor_status_for_storm.sh >/dev/null 2>&1)

4、supervisor节点部署

vim /data/scripts/restart_storm_service.sh

1
2
3
4
5
6
#!/bin/sh
PATH= /sbin : /bin : /usr/sbin : /usr/bin : /usr/local/bin : /usr/local/sbin
  
/etc/profile
[[ -n ` ps  aux |  grep  java |  grep  storm` ]] &&  kill  -9 ` ps  aux |  grep  java |  grep  storm |  awk  '{print $2}' `
nohup  /usr/local/storm/bin/storm  supervisor > /dev/null  2>&1 &



本文出自 “人生理想在于坚持不懈” 博客,请务必保留此出处http://sofar.blog.51cto.com/353572/1579894

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值