这是我学到的一些小技巧,在 AWS 文档中并不清楚。
问题
当您在 AWS (EKS)中拥有 Kubernetes 集群时,您将需要为每个节点的磁盘提供大量空间。
如果不是,您将遇到一些PLEG is not healthy错误。
解决方案
按照 AWS 支持的建议,(在我的例子中)我需要将此值设置为150Go以便为您的所有 pod/images/deployments 留出一些空间…
奇怪的是,我还没有看到任何文档来解释我们需要为每种 EC2 实例定义多少。
如果你有这个链接,请发给我。
监控
您还可以监控 Cloudwatch 中的一些值(如果您的集群上有 cloudwatch 代理)以检查是否一切正常,并设置一些警报以了解是否发生了错误。
链接:AWS 文档
https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/metrics-collected-by-CloudWatch-agent.html