应用没有配置自动重试机制,因此发布或其他原因关闭时,调用方未及时更新本地缓存的IP,继续调用必然会有很多500错误。可用性要求低或访问量低的服务可能无感,但咱可是全国第四的充电SAAS平台,肯定不能接受这样的问题。
这个错误场景如图:
要解决这个问题,K8S的prestop钩子函数就能派上用场了,即容器销毁前,先执行下线操作。
容器销毁前,执行prestop.sh脚本,脚本的参数是注册在eureka中的应用名称:
脚本:
# more prestop.sh
#!/bin/bash
if [ $# != 1 ]; then
echo "Usage: $0 eureka-appname"
exit 1
fi
HOSTNAME=`hostname`
PODIP=`cat /etc/hosts | grep $HOSTNAME | awk '{print $1}'`
EUREKA_APPNAME=$1
if [[ "${EUREKA_APPNAME}" == "none" ]]; then
exit 0;
else
curl --connect-timeout 10 -m 20 -sX PUT http://<注册中心IP>:<port>/eureka/apps/${EUREKA_APPNAME}/${PODIP}:<应用统一port>/status?value=DOWN
sleep 10
fi
so easy!