容器平台自愈简介,kubernetes集群巡检 remedy controller

容器平台自愈简介

公有云现状

摘自:https://mp.weixin.qq.com/s/CLoALO6r9bb3cE7CLTvZUQ

 

各类硬件和软件故障已成为常态,直接导致 Kubernetes 集群工作节点时常处于一种不稳定的状态,人肉运维不仅效率低下,误操作及 24 小时 OnCall 也是巨大的挑战,因此容器服务通过托管节点池为用户提供了一个自愈的免运维的云上 Kubernetes 集群服务。本文将重点介绍如何通过托管节点池实现 Kubernetes 节点自愈能力。

阿里云公有云提供了托管节点池来帮助私有Kubernetes集群进行节点自愈。Kubernetes的硬件和软件出现故障已经成为常态。此时K8S集群中对应的节点会处于不稳性的状态。人肉运维效率低下,且容易造成误操作引发更大的风险。

自愈的重点在两方面,问题的检测和故障修复。

在K8S集群中的问题主要包括硬件和软件。

硬件包括:内存板卡损坏、磁盘坏道、网卡控制器故障,机房断电跳闸、光缆故障。

软件包括:软件 OOM、进程句柄泄露、IO hang、磁盘满、网络断链,系统负载过高,docker,kubelet故障,运行环境等。

(此处阿里分为了三类:硬件故障(内存板卡损坏、磁盘坏道、网卡控制器故障)、软件故障(软件 OOM、进程句柄泄露、IO hang、磁盘满、网络断链)、机房断电跳闸、光缆故障、系统负载过高等。)

将故障进行抽象分类分层:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Remedy是一款由BMC软件公司推出的开发工具,主要用于应用程序的开发和管理。Remedy具有强大的功能和灵活的架构,可以满足不同规模和需求的开发项目。 Remedy的开发工具集包括Remedy Developer Studio、Remedy AR System和Remedy Application Server等组件。Remedy Developer Studio是一个集成开发环境,提供可视化的界面和丰富的开发工具,可以快速创建、定制和部署应用程序。用户可以通过拖拽、配置和编写代码来实现业务逻辑和用户界面的设计,极大地提高了开发效率和灵活性。 Remedy AR System是Remedy的核心组件,提供了底层的应用程序框架和数据管理功能。它支持多种数据源和数据类型,可以将数据集成到统一的平台中进行管理和分析。Remedy AR System还提供了安全性和权限管理、工作流引擎和通信协议等功能,以满足复杂的业务需求。 Remedy Application Server是Remedy的运行时环境,用于部署和运行开发的应用程序。它提供了可扩展的架构和高效的性能,可以支持大规模的用户和并发访问。Remedy Application Server还提供了监控和故障排除工具,方便开发人员进行应用程序的管理和维护。 总之,Remedy开发工具是一款功能强大的开发工具,可以帮助开发人员快速创建、定制和部署应用程序。它的灵活性和可扩展性使得开发工作更加高效和便捷,能够满足不同规模和需求的开发项目。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值