昨日遇到一个故障,数据库可以启动,但是很多chunk文件都是PD的状态。
于是做如下检查:
1、ls -l /date/datachunk/xxx_dbsx
检查chunk 文件的属性,发现权限和文件大小都是正常的
2、onspaces修复chunk状态,没戏
和用户沟通故障的时都发生了什么,被告知只有网络断开了一会儿,百思不得解,网络断开会为什么会影响chunk文件???难道是NFS,询问用户,用户压根就没有听过什么是NFS。
登录现场自己看,果然是NFS!!!
df -h 看到的状态是正常的啊....
检查NFS的服务状态,发现NFS的CLIENT端的服务启动是有问题的,于是操作如下:
1、启动NFS CLIENT SERVICE。
2、启动数据库
3、修复CHUNK状态
4、数据库状态正常
随后是一阵惊喜。。。。。。。。
第二天被告知数据库无法访问,登录之后报错如下:
一通操作之后,发现还是没戏。
oncheck -cc是失败的。
总之,没有搞定!!!
结论:
数据库的datafile远离NFS~~~~~~