pg HA 上线后,我们遭遇到第一个故障,
由于启动了oracle_fdw 组件,oracle 的环境变量是写在postgres $HOME/.bash_profile 里面
HA 是由root 用户启动的。
启动数据库的命令在 /usr/lib/ocf/resource.d/heartbeat/pgsql 脚本的
runasowner()函数下面。
启动的脚本是这样写的
ocf_run $quietrun $loglevel su $OCF_RESKEY_pgdba -c "cd $OCF_RESKEY_pgdata; $*"
由于这里的su 没有使用 su - 导致,无法启动postgres用户下面的环境变量
导致oracle 的环境变量无法被启用,在oracle-fdw 的库文件oracle_fdw.so 文件调用oracle 的客户端的so文件 libclntsh.so.11.1
导致找不到so 文件,我们曾经尝试,把这个so文件链接到pg的lib目录下,再执行oracle_fdw的时候,解决了so文件找不到的问题,但是报的错误就是无法取到oracle 的envhandler
看来只有重启,载入环境变量才能解决了。
这里还有必须要把oracle的环境变量载入到HA 的环境变量里,所以不能简单的通过重启数据库解决,需要重启整个HA集群来重载。
曾将尝试 吧runasowner 函数的su 修改为su - 但是不成功,报错为找不到postgres 用户,同时报 PGDATA 目录不可写。
为了尽快解决问题,没有继续深究下去,
于是把oracle 的环境变量 跟PG的环境 变量加到了 /etc/profile 里面
重载root用户,然后重新启动HA 集群。 问题解决。
由于启动了oracle_fdw 组件,oracle 的环境变量是写在postgres $HOME/.bash_profile 里面
HA 是由root 用户启动的。
启动数据库的命令在 /usr/lib/ocf/resource.d/heartbeat/pgsql 脚本的
runasowner()函数下面。
启动的脚本是这样写的
ocf_run $quietrun $loglevel su $OCF_RESKEY_pgdba -c "cd $OCF_RESKEY_pgdata; $*"
由于这里的su 没有使用 su - 导致,无法启动postgres用户下面的环境变量
导致oracle 的环境变量无法被启用,在oracle-fdw 的库文件oracle_fdw.so 文件调用oracle 的客户端的so文件 libclntsh.so.11.1
导致找不到so 文件,我们曾经尝试,把这个so文件链接到pg的lib目录下,再执行oracle_fdw的时候,解决了so文件找不到的问题,但是报的错误就是无法取到oracle 的envhandler
看来只有重启,载入环境变量才能解决了。
这里还有必须要把oracle的环境变量载入到HA 的环境变量里,所以不能简单的通过重启数据库解决,需要重启整个HA集群来重载。
曾将尝试 吧runasowner 函数的su 修改为su - 但是不成功,报错为找不到postgres 用户,同时报 PGDATA 目录不可写。
为了尽快解决问题,没有继续深究下去,
于是把oracle 的环境变量 跟PG的环境 变量加到了 /etc/profile 里面
重载root用户,然后重新启动HA 集群。 问题解决。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/133735/viewspace-759301/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/133735/viewspace-759301/