具体更新内容,请看下方链接中的文档!!!
问题一:ocp8080端口,ocp白屏错误
可能1.你的服务器性能不行。(这点没验证过)
可能2:因为ocp服务器重启之后时间发生跳变 ,但是默认配置得时间同步追得太慢,导致ob启动异常;修改时间之前,ob显示启动起来但是连接不上 ,修改时间正常之后,clog和ilog中日志时间异常,ob启动异常。解决方法:删除clog和ilog下得所有东西,然后docker restart metadb 和 docker restart ocp 等待几分钟后即可恢复正常。(已验证,删除ocp安装的/data/log1/集群名 下的clog与ilog中内容,成功!)
情况2:(ocp主机存在8080端口,但是web页面访问不到)
原因:由于安装集群时做的do io bech,对线程进行压力测试,可能会导致8080断开,或者链接超时情况,不用慌,在下方手动启动ocp!!!
情况1和情况2:皆可使用手动启动ocp
进入你装的ocp主机中,进入docker exec -it ocp bash中,然后./ocp-server start启动ocp
[root@dbserver10 ~]# docker exec -it ocp bash
[root@dbserver10 admin]# ls
alarm_send_script_demo.py alarm_send_script_demo.sh bin data ic-server logs ocp-server README.md tmp tools
[root@dbserver10 admin]# cd ocp-server/bin/
[root@dbserver10 bin]# pwd
/home/admin/ocp-server/bin
[root@dbserver10 bin]# ls
oas-cloud ocp-bootstrap ocp_docker_ctl.sh ocp-server
[root@dbserver10 bin]# ./ocp-server start
问题二:创建集群时,Make dir for ob 报错
解决办法:创建文件夹
问题三:创建集群时,初始化问题
解决办法:
问题三中,还会有另一个问题,就是时间同步问题,你最好不要用ntp做时间同步,选择chrony方式,因为上面Do io bench压测时,对网络压测容易直接给弄断了网络。(chrony时间同步请看我下面的操作)
问题四:设备资源有限
问题五:OAT时钟同步问题
问题:
可能1:由于卸载后重新配置observe时,忘记删除chrony.cnf文件:读取时钟文件时出错了
可能2:同步时差过大
而且你选择放弃任务时,你会发现放弃无法成功。
解决办法:将其设置成功,然后检查etc下chrony.cnf文件是否还存在chrony.cnf.old
删除旧的chrony.cnf.old文件,然后,你重启时钟systemctl restart chronyd,用timedatectl看是否已经同步
然后再OAT中重新做一下时钟的任务。
问题六:Bootstrap ob报错
情况一:右面没有报错,只显示超时,然后查看节点日志
[root@dbserver7 log]# pwd
/home/admin/oceanbase/log
cat observer.log* | grep ERROR | tail -l
ERROR [BOOTSTRAP] bootstrap (ob_service.cpp:2486) [25665][1086][YB420A640007-0005AB940A0B5090] [lt=52] [dc=0] execute bootstrap fail(master_rs="xxx.xxx.xxx:2882",rpc_timeout=600000000, ret=-4012)
编号4012
这个问题看文档:官方说法链接
(我的处理是,隔半小时,重试任务,结果就过了!!!)
其余各种情况官方文档:官方错误案例
情况二:如果bootstrap ob 报bash异常,和超时情况
原因:cpu或内存可能跑满了,卡主了。你的硬件cpu,资源的达不到要求。
处理办法:不要关闭ocp节点主机,重启所有节点主机,然后等待,看看端口是不是都在线。进入web页面点击重试即可!
安装文档(将链接复制导航栏搜索):https://www.yuque.com/liushisan-wcl99/wqd4cw/mb2eaifbfgafxxmb?singleDoc# 《OceanBase安装部署》