本文介绍了8个常用的监控数据shell脚本。首先回顾了一些DBA常用的Unix命令,以及解释了如何通过Unix Cron来定时执行DBA脚本。网上也有好
多类似的文章,但基本上都不能正常运行,花点时间重新整理了下,以后就能直接使用了。
一、文章介绍8个重要的脚本来监控Oracle数据库:
1.检查实例的可用性
2.检查监听器的可用性
3.检查alert日志文件中的错误信息
4.在存放log文件的地方满以前清空旧的log文件
5.分析table和index以获得更好的性能
6.检查表空间的使用情况
7.找出无效的对象
8.监控用户和事务
二、DBA需要的Unix基本知识
基本的UNIX命令,以下是一些常用的Unix命令:
ps--显示进程
grep--搜索文件中的某种文本模式
mailx--读取或者发送mail
cat--连接文件或者显示它们
cut--选择显示的列
awk--模式匹配语言
df--显示剩余的磁盘空间
以下是DBA如何使用这些命令的一些例子:
1. 显示服务器上的可用实例:
$ ps -ef| grep smon
oracle 22086 1 0 02:32:24 0:04 ora_smon_PPRD10
oracle 5215 28972 0 08:10:19 pts/4 0:00 grep smon
2. 显示服务器上的可用监听器:
$ ps -ef | grep listener |grep -v grep
(grep命令应该加上-i参数,即grep -i listener,该参数的作用是忽略大小写,因为有些时候listener是大写的,这时就会看不到结果)
$ ps -ef|grep -i listener
oracle 9655 1 0 Mar 12 0:01 /data/app/oracle/9.2.0/bin/tnslsnr LISTENER -inherit
oracle 22610 1 0 02:45:02 0:02 /data/app/oracle/10.2.0/bin/tnslsnr LISTENER -inherit
oracle 5268 28972 0 08:13:02 pts/4 0:00 grep -i listener
3. 查看Oracle存档目录的文件系统使用情况
$ df -k | grep /data
/dev/md/dsk/d50 104977675 88610542 15317357 86% /data
4. 统计alter.log文件中的行数:
$ cat alert_PPRD10.log | wc -l
13124
$ more alert_PPRD10.log | wc -l
13124
5. 列出alert.log文件中的全部Oracle错误信息:
$ grep ORA-* alert.log
ORA-00600: internal error code, arguments: [kcrrrfswda.1], [], [], [], [], []
ORA-00600: internal error code, arguments: [1881], [25860496], [25857716], []
6. CRONTAB基本
一个crontab文件中包含有六个字段:
分钟 0-59
小时 0-23
月中的第几天 1-31
月份 1 - 12
星期几 0 - 6, with 0 = Sunday
7. Unix命令或者Shell脚本
要编辑一个crontab文件,输入: Crontab -e
要查看一个crontab文件,输入: Crontab -l
0 4 * * 5 /dba/admin/analyze_table.ksh
30 3 * * 3,6 /dba/admin/hotbackup.ksh /dev/null 2>&1
在上面的例子中,第一行显示了一个分析表的脚本在每个星期5的4:00am运行。第二行显示了一个执行热备份的脚本在每个周三和周六的3:
00a.m.运行。
三、监控数据库的常用Shell脚本
以下提供的8个shell脚本覆盖了DBA每日监控工作的90%,你可能还需要修改UNIX的环境变量。
1. 检查Oracle实例的可用性
oratab文件中列出了服务器上的所有数据库
$ cat /var/opt/oracle/oratab
#
# This file is used by ORACLE utilities. It is created by root.sh
# and updated by the Database Configuration Assistant when creating
# a database.
# A colon, ':', is used as the field terminator. A new line terminates
# the entry. Lines beginning with a pound sign, '#', are comments.
#
# Entries are of the form:
# $ORACLE_SID:$ORACLE_HOME:<N|Y>:
#
# The first and second fields are the system identifier and home
# directory of the database respectively. The third filed indicates
# to the dbstart utility that the database should , "Y", or should not,
# "N", be brought up at system boot time.
#
# Multiple entries with the same $ORACLE_SID are not allowed.
#
#
# *:/data/app/oracle/9.2.0:N
TRNG:/data/app/oracle/9.2.0:Y
*:/data/app/oracle/9.2.0:N
PPRD:/data/app/oracle/10.2.0:Y
PPRD10:/data/app/oracle/10.2.0:N
以下的脚本检查oratab文件中列出的所有数据库,并且找出该数据库的状态(启动还是关闭)
###################################################################
## ckinstance.ksh ##
###################################################################
ORATAB=/var/opt/oracle/oratab
echo "`date` "
echo "Oracle Database(s) Status `hostname` :/n"
db=`egrep -i ":Y|:N" $ORATAB | cut -d":" -f1 | grep -v "^#" | grep -v "^*"`
pslist="`ps -ef | grep pmon`"
for i in $db
do
echo "$pslist" | grep "ora_pmon_$i" > /dev/null 2>&1
if (( $ )); then
echo "Oracle Instance - $i: Down"
else
echo "Oracle Instance - $i: Up"
fi
done
使用以下的命令来确认该脚本是可以执行的:
$ chmod 744 ckinstance.ksh
$ ls -l ckinstance.ksh
-rwxr--r-- 1 oracle dba 657 Mar 5 22:59 ckinstance.ksh
以下是实例可用性的报表:
$ sh ckinstance.ksh
Wed May 13 12:51:20 PDT 2009
Oracle Database(s) Status gambels :
Oracle Instance - PPRD: Up
Oracle Instance - PPRD10: Up
Linux :
###################################################################
## ckinstance.ksh ##
###################################################################
ORATAB=/etc/oratab
echo "`date` "
echo "Oracle Database(s) Status `hostname`"
db=`egrep -i ":Y|:N" $ORATAB | cut -d":" -f1 | grep -v "^#" | grep -v "^*"`
pslist="`ps -ef | grep pmon`"
for i in $db
do
echo "$pslist" | grep "ora_pmon_$i" > /dev/null 2>&1
if (( $ )); then
echo "Oracle Instance - $i: Down"
else
echo "Oracle Instance - $i: Up"
fi
Done
Shell 2:
###################################################################
## ckinstance.ksh ##
###################################################################
echo "`date` "
echo "Oracle Database(s) Status `hostname` "
namelst=`ps -ef|grep ora_pmon|grep -v grep|awk '{print $8}'|cut -c10-15`
for name in $namelst
do
if [ -z $name ];then
echo "Oracle Instance - $name: Down"
else
echo "Oracle Instance - $name: Up"
fi
done
2. 检查Oracle Instance 的可用性
#####################################################################
## cklsnr.sh ##
#####################################################################
#!/bin/ksh
TNS_ADMIN=/var/opt/oracle; export TNS_ADMIN
ORACLE_SID= PPRD10; export ORACLE_SID
ORAENV_ASK=NO; export ORAENV_ASK
PATH=$PATH:/bin:/usr/local/bin; export PATH
. oraenv
DBALIST="tianlesoftware@vip.qq.com,tianlesoftware@hotmail.com";export DBALIST
cd /var/opt/oracle
rm -f lsnr.exist
ps -ef | grep PPRD10 | grep -v grep > lsnr.exist
if [ -s lsnr.exist ]
then
echo "listener is up !"
else
echo "Alert" | mailx -s "Listener 'PPRD10' on `hostname` is down" $DBALIST
lsnrctl start PPRD10
fi
Linux:
检查Oracle监听器的可用性
以下有一个类似的脚本检查Oracle监听器。假如监听器停了,该脚本将会重新启动监听器:
#!/bin/bash
lsn=`netstat -an |grep :1521 |head -1 |awk '{print $4}'|cut -c9-12`
echo "Current Listener Port is : $lsn"
if [ $lsn = '1521' ] ;then
echo 'listener is up !'
else
echo "This `hostname` listener is down !"
lsnrctl start
fi
3. 检查Alert日志(ORA-XXXXX)
####################################################################
## ckalertlog.sh ##
####################################################################
#!/bin/ksh
EDITOR=vi; export EDITOR
ORACLE_SID=PPRD10; export ORACLE_SID
ORACLE_BASE=/data/app/oracle; export ORACLE_BASE
ORACLE_HOME=$ORACLE_BASE/10.2.0; export ORACLE_HOME
LD_LIBRARY_PATH=$ORACLE_HOME/lib; export LD_LIBRARY_PATH
TNS_ADMIN=/var/opt/oracle;export TNS_ADMIN
NLS_LANG=american; export NLS_LANG
NLS_DATE_FORMAT='Mon DD YYYY HH24:MI:SS'; export NLS_DATE_FORMAT
ORATAB=/var/opt/oracle/oratab;export ORATAB
PATH=$PATH:$ORACLE_HOME:$ORACLE_HOME/bin:/usr/ccs/bin:/bin:/usr/bin:/usr/sbin:/sbin:/usr/openwin/bin:/opt/bin:.; export PATH
DBALIST="tianlesoftware@vip.qq.com,tianlesoftware@hotmail.com";export DBALIST
cd $ORACLE_BASE/admin/PPRD10/bdump
if [ -f alert_PPRD10.log ]
then
mv alert_PPRD10.log alert_work.log
touch alert_PPRD10.log
cat alert_work.log 》 alert_PPRD10.hist
grep ORA- alert_work.log > alert.err
fi
if [ `cat alert.err | wc -l` -gt 0 ]
then
mailx -s " PPRD10 ORACLE ALERT ERRORS" $DBALIST < alert.err
fi
rm -f alert.err
rm -f alert_work.log
改进版:
-----------------------------------------------------
name=cuug
cd $ORACLE_BASE/admin/"$name"/bdump
if [ -f alert_"$name".log ]
then
mv alert_$name.log alert_work.log
touch alert_$name.log
cat alert_work.log 》 alert_$name.hist
grep ORA- alert_work.log > alert.err
fi
if [ `cat alert.err | wc -l` -gt 0 ]
then
echo "Database is error … `date`" 》err.txt
fi
rm -f alert.err
rm -f alert_work.log
-----------------------------------------------------------
4. 清除旧的归档文件
以下的脚本将会在log文件达到90%容量的时候清空旧的归档文件:
$ df -k | grep arch
Filesystem kbytes used avail capacity Mounted on
/dev/vx/dsk/proddg/archive 71123968 30210248 40594232 43% /u08/archive
#######################################################################
## clean_arch.ksh ##
#######################################################################
#!/bin/ksh
df -k | grep arch > dfk.result
archive_filesystem=`awk -F" " '{ print $6 }' dfk.result`
archive_capacity=`awk -F" " '{ print $5 }' dfk.result`
if [ $archive_capacity > 90% ]
then
echo "Filesystem ${archive_filesystem} is ${archive_capacity} filled"
# try one of the following option depend on your need
find $archive_filesystem -type f -mtime +2 -exec rm -r {} ;
fi
Linux :
#!/bin/bash
export EDITOR=vi
export ORACLE_SID=oradb
export ORACLE_BASE=/u01/app/oracle
export ORACLE_HOME=$ORACLE_BASE/product/10.2.0/db_1
export ORA_CRS_HOME=$ORACLE_BASE/product/10.2.0/crs_1
export LD_LIBRARY_PATH=$ORACLE_HOME/lib
export PATH=$ORACLE_HOME/bin:$ORA_CRS_HOME/bin:/bin:/usr/bin:/usr/sbin:/usr/local/bin:/usr/X11R6/bin
#######################################################################
## clean_arch.ksh ##
#######################################################################
#!/bin/bash
# $ df -k | grep arch
#Filesystem kbytes used avail capacity Mounted on
#/dev/vx/dsk/proddg/archive 71123968 30210248 40594232 43% /u08/archive
df -k | grep arch > dfk.result ;/u08/archive 文件系统用于存放归日志
archive_filesystem=`awk -F" " '{ print $6 }' dfk.result`
archive_capacity=`awk -F" " '{ print $5 }' dfk.result`
if [ $archive_capacity > 90% ]
then
echo "Filesystem ${archive_filesystem} is ${archive_capacity} filled"
# try one of the following option depend on your need
arch_dir=/disk1/arch/oradb
for name in `find $arch_dir -type f -mtime +2`
do
mv $name /home/oracle/backup ;将超过两天以上的归档日志迁移到备份点
done
oracle视频教程请关注:http://u.youku.com/user_video/id_UMzAzMjkxMjE2.html
转载于:https://blog.51cto.com/19880614/1252444