最近,一直在研究oracle enterprise grid control。从看文档到配置完成,经过了很多的曲折,下面描述如下,希望我的收获也能给朋友们以参考。
1、 环境:
Os:IBM aix 5.3.0.8
Cpu:2×2.2G Hz
Memory :10G
磁盘:内置硬盘,168G
这其实是我的一台练习机器的分区。
2、 安装步骤;
a) 软件资源准备
在下载软件之前,我先在itpub.net上,下载了1.1和2.0版的ou sg。Oracle的软件下载还不错,我的速度大约1MB/s。我想安装的是oracle enterprise grid control 10.2.0.4,但是必须下载oracle enterprise grid control 10.2.0.1(full installer)和oracle enterprise grid control 10.2.0.4 (patch set),这也是oracle的特色吧。软件下载完成后,ftp到我的机器上,主机名:gridi4。注意,这个不是一个普通的名字,这个名字至少浪费了我两天时间。详情见下文。
b)oracle基本环境准备,这和以往的安装差不多。注意,差不多,还是差很多。
首先建立了2个文件系统:/oracle和/oracle_software。分别用于安装软件和存放安装介质。把软件上传到gridi4上之后,估计有部分人就会傻眼了,文件扩展名是“.zip”,aix下没有命令能够解压,还是oracle想得周全,在下载页面有个链接,提供各种版本的unzip供大家使用,废话不说,弄个文件,放在了gridi4的/bin目录下,解压缩用如下方式即可:
#unzip –d AIX_Grid_Control_full_10201_disk1.zip
--这个命令自动把多卷解压缩在一个目录下。
这样软件就准备好了。
3)那就开始装吧。这里有个问题,需要大街注意,那就是.profile。一般说来,安装oroacle软件,例如数据库,每个安装文档总是讲要先配置环境变量,但这次不同。只需要建立oracle用户和dba组即可,不需要设置oracle的.profile内容。
把下载的安装介质解压,需要用到mpio和unzip,如果不会用,自己google吧。
进入到解压好的Disk1的目录,运行:
$./runInstaller
一般来讲,如果你想省点事的话,选择安装到新新建数据库中。因为repository内容要存储在数据库中,这个版本内置的是10.0.0.1版本的oracle 10g。前半程没有什么问题,一路“next”下去,和安装oracle数据库差别不大,也会用 root 运行2个脚本。到了最后的环节,很多人会出错。配置oms和agent,这是最后两个步骤,很多人都会功亏一篑。
为什么会出现这样的现象呢?我分开讲述。
(1) 配置oms错误,多半问题出现在listener上,如果这台机器上原来有listener,并且port 为 1521,则肯定会出错。因为新装的10.0.0.1的listener与原有的listener port(1521)冲突,如何解决呢?修改原有listener的port。
(2) 配置agent错误,这个问题出现的比较搞笑。我在2周内安装了10几次,没有一次成功,全部是卡在这了。因为软件安装在最后,会生成agent模块的配置文件:
/oracle/OracleHomes/agent10g/sysman/config/emd.properties。其中关键点有三行:
REPOSITORY_URL=https://gridi4:1159/em/upload
emdWalletSrcUrl=http://gridi4:4889/em/wallets/emd
EMD_URL=https://gridi4:3872/emd/main/
在网上,很多解决方案均提到了主机名配置问题,但我认为没说到点上。关键点就一个:主机名不要有大写,/etc/hosts配置不要弄错就可以了。我最开始的主机名:GRIDI4,安装到配置agnet的时候,以上三行中,主机名有两个是大写,一个是小写,总是不能通过。这是安装程序脚本的bug,奉劝大家,如果想顺利安装,主机名一定要小写。我在碰壁多次之后终于醒悟了,改为了小写,结果到这还是不能成功。看网上的文档,一般不详解这个问题,我在有实验了几次之后,决定不管三七二十一,打补丁吧,说不定,10.2.0.1在aix还有除了主机名大小写之外的问题。
老天不负有心人,我在打了补丁之后,竟然成功了。
在这插叙一下,如何打补丁。其实很简单,解压缩补丁介质之后,进到3731593这个目录,运行runInstaller,在选择安装目录时,在上方下来菜单里面选择oms10g和agent10g即可,当然,安装前一定要停掉oms和agent服务(好像它就没起来过),安装两遍,dell的文档说安装四遍,我看不需要,除非你还想把内置的oracle 10g 10.0.0.1也升级。
安装完补丁,不出意外的话,就可以启动了,我找了浏览器,输入http://gridi4:4889/em/,出现了登录界面,登录后,发现“home”下的“overview”中,出现了up:1,unkonw:13,这说明agent其作用了,分别进入到agnet里面配置一下,就成为up:13:unkonwn:1了,这个unkown是microsfot mom,IBM机器没有这些东西,所以不用管它。
终于安装成功了,我的心情很舒畅,我想歌唱,啦啦啦……..,怎么我的securecrt登陆窗口死掉了,再刷新网页也不行了,这是为什么呢?我刚感受到成功的喜悦,怎么又给我当头一棒呢!
各位请认真看了,以下才是本文的重点,当然前面所述与以下内容也有关。
我重新登录终端窗口以后,执行:
bash-3.2$ ./emctl status agent
Oracle Enterprise Manager 10g Release 4 Grid Control 10.2.0.4.0.
Copyright (c) 1996, 2007 Oracle Corporation. All rights reserved.
---------------------------------------------------------------
Agent is Not Running
我的天,怎么刚成功就又停掉呢?分析操作系统日志,发现大量的软件异常终止错误,都和agent10g有关,他为什么刚起来就停掉呢?分析agent10g的emd.trc,发现最后几条说系统没有足够的内存,不会吧,我的机器可是有10G的内存,很多人的生产机的配置也不一定比我的好啊,难道还运行不了你这grid control。肯定有内存泄漏,agent进程被操作系统强行结束了。回想一下,确实有很多可疑的地方,例如我在安装的时候,xmanager窗口多次强行结束,这在以前从未出现过。又经过一番狂搜,终于在韩国人的oracle 论坛上找到了答案:
修改oracle用户的profile,添加如下内容:
LDR_CNTRL="MAXDATA=0x80000000"
export LDR_CNTRL
AIXTHREAD_SCOPE=S
export AIXTHREAD_SCOPE
AIXTHREAD_MUTEX_DEBUG=OFF
export AIXTHREAD_MUTEX_DEBUG
AIXTHREAD_RWLOCK_DEBUG=OFF
export AIXTHREAD_RWLOCK_DEBUG
AIXTHREAD_COND_DEBUG=OFF
export AIXTHREAD_COND_DEBUG
然后重新启动agent,一切ok,我的系统连续运行几天,在没有出现过内存泄露的情况,系统负载很轻,oem界面一切正常。我成功了!
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/115963/viewspace-590749/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/115963/viewspace-590749/