问题描述:
运行好好的VCSA突然无法访问,web页面报错:
503 Service Unavailable (Failed to connect to endpoint: [[N7Vmacore4Http16LocalServiceSpecE:0x00005649e04415e0] _serverNamespace = / _isRedirect = false _pipeName =/var/run/vmware/vpxd-webserver-pipe)
原因分析:
https://kb-uat.vmware.com/s/article/67818?lang=zh_cn
我比较经常遇到的原因有:
- vCenter Server Appliance (VCSA) 高虚拟磁盘空间(76563)
- 检查 vCenter Server 上证书的过期日期 (79248/82332)
- VCSA的vsphere-vxpd服务异常,未正常运行;
解决方案:
一、vCenter Server Appliance (VCSA) 高虚拟磁盘空间(76563)
https://kb-uat.vmware.com/s/article/76563?lang=zh_cn
- 以 root 用户身份通过 SSH 或通过 vCenter 虚拟机控制台登录到 vCenter Server Appliance,找出哪些分区已满;
运行以下命令,可找出已满 85% 或更高的分区:df -h
df -h |awk '0+$5 >= 85 {print}'
- 查找日志大文件,确定没用就删除,注意:*.tgz 文件是已存档的日志包文件,可以移除。
find /storage/log -type f -size +100M
二、检查 vCenter Server 上证书的过期日期 (79248/82332)
https://kb.vmware.com/s/article/79248?lang=zh_cn
https://kb-uat.vmware.com/s/article/82332
这个证书过期的事情经常在VCSA6.0上遇到,因为VCSA6.0的STS证书一般是2年就到期,很坑,一到期就挂机。遇到过两三次,按照这个官方KB,一次都没能成功处理好,不懂为啥~。折腾最后就是重新部署VCSA啦,反而更快更省事(前提是你的VCSA上面的管理的主机少,重新加一遍也不麻烦)。
不过,VCSA6.5及其以上出现这个问题倒是还没遇到过,有遇到的可以参考官方KB。
三、VCSA的vsphere-vxpd服务异常,未正常运行
因为以前我自己部署VCSA都是"vCenter Server with an embedded Platform Services Controller",然后遇到次503错误,VCSA也上去看了空间使用率、vsphere-client服务啥的都挺正常,就是vsphere-vxpd服务起不来,仔细看了一下,发现VCSA架构是"vCenter Server with an external Platform Services Controller",意思还有一台单独的Platform Services Controller虚拟机,怀疑是PSC出问题了,但是不知道root密码,只能强制重启了,由于非正常关机,开机进入了紧急救援模式,
提示 Failed to start system check on /dev/disk/by-partuuid/***
反手就是一个
fsck /dev/disk/by-partuuid/***
再重启了一下,正常开机了,回到VCSA,重启了一下所有服务
service-control --stop --all
service-control --start --all
至此,VCSA终于正常访问了。