最近在客户现场,每日都需要巡检大量主机系统的备库信息。如果一台台执行,时间浪费的就太冤枉了。
参考同事之前写的一个python脚本,配合各主机上写好的shell检查脚本,实现一次操作得到所有巡检结果。
这里的Python脚本需要用到paramiko模块。
安装paramiko有两个先决条件,python和另外一个名为PyCrypto的模块。
yum install python-crypto python-paramiko 或者
单独下载模块,python setup.py build && python setup.py install 安装。
因为我把文章分类为“一步一步学python”系列,所以我将这样简单的脚本也进一步细分为3个过程,便于初学者理解,也体现出一个循序渐进的思路。
1.测试python连接主机执行命令
下面就是使用python,连接一台主机,并执行一条简单的系统命令,测试python连接主机执行命令的功能可用。
[oracle@jydg ~]$ python
Python 2.6.6 (r266:84292, Sep 4 2013, 07:46:00)
[GCC 4.4.7 20120313 (Red Hat 4.4.7-3)] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import paramiko
>>> s = paramiko.SSHClient()
>>> s.set_missing_host_key_policy(paramiko.AutoAddPolicy())
>>> s.connect(hostname = '192.168.56.158', port = 22, username = 'oracle', password = 'oracle')
>>> sshcmd = 'df -h'
>>> stdin, stdout, stderr = s.exec_command(sshcmd)
>>> print stdout.read()
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/vg_linuxbase-lv_root 28G 12G 15G 46% /
tmpfs 499M 171M 328M 35% /dev/shm
/dev/sda1 485M 39M 421M 9% /boot
>>> s.close()
>>> exit()
将上述测试过程形成python脚本conn.py
#!/usr/bin/python
# -*- coding: utf8 -*-
#Function: 连接主机执行命令
#Usage: python conn.py
#Author: Alfred Zhao
#Created: 2017/02/22
#Version: 1.01
import paramiko
s = paramiko.SSHClient()
s.set_missing_host_key_policy(paramiko.AutoAddPolicy())
s.connect(hostname = '192.168.56.158', port = 22, username = 'oracle', password = 'oracle')
sshcmd = 'df -h'
stdin, stdout, stderr = s.exec_command(sshcmd)
print stdout.read()
print stderr.read()
s.close()
脚本conn.py只是实现连接到固定主机,并执行简单命令。
2.将执行命令改为执行指定脚本
下面的python脚本 checkdg.py,和上面脚本的主要区别就是将具体执行的命令改为一个shell脚本。这样就可以轻松的去写更复杂的命令。
python脚本 checkdg.py
#!/usr/bin/python
# -*- coding: utf8 -*-
#Function: Check Oracle DG Status
#Usage: python checkdg.py
#Author: Alfred Zhao
#Created: 2017/02/22
#Version: 1.01
import paramiko
s = paramiko.SSHClient()
s.set_missing_host_key_policy(paramiko.AutoAddPolicy())
s.connect(hostname = '192.168.56.158', port = 22, username = 'oracle', password = 'oracle')
sshcmd = 'sh /home/oracle/checkdg.sh'
stdin, stdout, stderr = s.exec_command(sshcmd)
print stdout.read()
print stderr.read()
s.close()
注意:脚本checkdg.py只是实现连接到固定主机,并执行指定的shell脚本文件,脚本中必须设置正确的环境变量。
这里的shell脚本"/home/oracle/checkdg.sh"内容参考如下:
#!/bin/bash
export ORACLE_BASE=/u01/app/oracle
export ORACLE_HOME=/u01/app/oracle/product/11.2.0/dbhome_1
export ORACLE_SID=jyzhao_s
export NLS_LANG="american_america.ZHS16GBK"
export NLS_DATE_FORMAT="YYYY-MM-DD HH24:Mi:SS"
export LD_LIBRARY_PATH=$ORACLE_HOME/lib
export PATH=$ORACLE_HOME/bin:$PATH
echo ' ###### SID: '$ORACLE_SID
sqlplus -s /nolog <<EOF
connect / as sysdba
col VALUE for a20
col TIME_COMPUTED for a30
col name for a25
col UNIT for a30
col DATUM_TIME for a30
set line 400
select * from v\$dataguard_stats;
--select name,total_mb,free_mb,OFFLINE_DISKS,STATE from v\$asm_diskgroup;
exit;
EOF
df -h|egrep -e "Filesystem|lv_root"
3.将固定主机修改为主机列表
下面的python脚本 checkdg_all.py 只是将固定主机修改为主机列表,这样就可以批量的在多台配置好的主机上执行各自的脚本,执行的具体结果一次就能汇总得到。
python脚本 checkdg_all.py
#!/usr/bin/python
# -*- coding: utf8 -*-
#Function: Check Oracle DG Status
#Usage: python checkdg_all.py
#Author: Alfred Zhao
#Created: 2017/02/22
#Version: 1.01
import paramiko
#连接指定多个主机
ipadress = ['192.168.56.158','192.168.56.158']
username = ['oracle','ora10']
password = 'oracle'
port = 22
num = 0
s = paramiko.SSHClient()
s.set_missing_host_key_policy(paramiko.AutoAddPolicy())
for hostname in ipadress:
print("####################################################################\
#######################################################################")
print(" ############################### IP Addreess:\
" + str(hostname).ljust(15) + str(username[num]) + " ############################")
s.connect(hostname = hostname, port = port, username = str(username[num]), password = password)
sshcmd = 'sh /home/' + str(username[num]) + '/checkdg.sh'
stdin, stdout, stderr = s.exec_command(sshcmd)
print stdout.read()
print stderr.read()
num += 1
s.close()
这里的巧妙之处是,假设同一台主机不同用户下分别安装了oracle,比如我这里是oracle用户安装11g版本数据库,ora10用户安装10g版本数据库。
那么,这种情况可以认定为和多个主机一样。(也就是IP地址一样,用户不同,那么对应的脚本路径/home/username/checkdg.sh, 由于username不一样,所以完全不影响)
因此,顺便提一下,如果有人要求你在一台机器上安装不同版本的oracle数据库软件,你最好与其沟通,建议使用不同的用户来安装,后期也会方便区分和维护。
同时,如果你的环境密码不统一,甚至ssh的端口都有机器不是默认端口,你也可以修改脚本中的对应变量为数组类型。
脚本的执行结果类似如下:
[oracle@jydg python]$ python checkdg_all.py
###########################################################################################################################################
############################### IP Addreess:192.168.56.158 oracle ############################
###### SID: jyzhao_s
NAME VALUE UNIT TIME_COMPUTED DATUM_TIME
------------------------- -------------------- ------------------------------ ------------------------------ ------------------------------
transport lag day(2) to second(0) interval 02/21/2017 11:49:48
apply lag day(2) to second(0) interval 02/21/2017 11:49:48
apply finish time day(2) to second(3) interval 02/21/2017 11:49:48
estimated startup time 12 second 02/21/2017 11:49:48
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/vg_linuxbase-lv_root 28G 12G 15G 46% /
###########################################################################################################################################
############################### IP Addreess:192.168.56.158 ora10 ############################
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/vg_linuxbase-lv_root 28G 12G 15G 46% /
tmpfs 499M 171M 328M 35% /dev/shm
/dev/sda1 485M 39M 421M 9% /boot
这样就可以迅速的发现问题,解决问题。
比如这里oracle用户下11g版本的DG库的apply lag没有值就存在异常,需要进一步人工分析处理,而ora10用户我只是临时演示,并没有安装相应的数据库。
至此,以后想批量巡检其他的一些信息,都可以根据这个python脚本配合各机器写好的脚本进行快速巡检,感觉还是很方便的。