Metrics-Server 插件和top命令

前言:
使用top命令查看需k8s使用资源信息,需要安装Metrics-Server 插件。
注意:这个kube-state-metrics是不一样的。

1. Metrics Server 插件

参考文档:https://github.com/kubernetes-sigs/metrics-server
注意:官网有坑不要按上边的来

1.1 编排文件

  • 下载地址:
    https://github.com/kubernetes-sigs/metrics-server/releases

选择合适的版本下载

  • 镜像准备

默认的 k8s.gcr.io的镜像下载不了,我们选择科学上网或下载阿里云镜像

registry.aliyuncs.com/google_containers/metrics-server-amd64:v0.3.6

  • 修改yaml文件

修改如下三处

  • 添加command(必要)
  • 添加limit(非必要)
  • 修改镜像(非必要)

components.yaml 文件修改如下:

---
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
  name: system:aggregated-metrics-reader
  labels:
    rbac.authorization.k8s.io/aggregate-to-view: "true"
    rbac.authorization.k8s.io/aggregate-to-edit: "true"
    rbac.authorization.k8s.io/aggregate-to-admin: "true"
rules:
- apiGroups: ["metrics.k8s.io"]
  resources: ["pods", "nodes"]
  verbs: ["get", "list", "watch"]
---
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
  name: metrics-server:system:auth-delegator
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: ClusterRole
  name: system:auth-delegator
subjects:
- kind: ServiceAccount
  name: metrics-server
  namespace: kube-system
---
apiVersion: rbac.authorization.k8s.io/v1
kind: RoleBinding
metadata:
  name: metrics-server-auth-reader
  namespace: kube-system
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: Role
  name: extension-apiserver-authentication-reader
subjects:
- kind: ServiceAccount
  name: metrics-server
  namespace: kube-system
---
apiVersion: apiregistration.k8s.io/v1beta1
kind: APIService
metadata:
  name: v1beta1.metrics.k8s.io
spec:
  service:
    name: metrics-server
    namespace: kube-system
  group: metrics.k8s.io
  version: v1beta1
  insecureSkipTLSVerify: true
  groupPriorityMinimum: 100
  versionPriority: 100
---
apiVersion: v1
kind: ServiceAccount
metadata:
  name: metrics-server
  namespace: kube-system
---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: metrics-server
  namespace: kube-system
  labels:
    k8s-app: metrics-server
spec:
  selector:
    matchLabels:
      k8s-app: metrics-server
  template:
    metadata:
      name: metrics-server
      labels:
        k8s-app: metrics-server
    spec:
      serviceAccountName: metrics-server
      volumes:
      # mount in tmp so we can safely use from-scratch images and/or read-only containers
      - name: tmp-dir
        emptyDir: {}
      containers:
      - name: metrics-server
        #image: k8s.gcr.io/metrics-server-amd64:v0.3.6
        image: registry.aliyuncs.com/google_containers/metrics-server-amd64:v0.3.6
        imagePullPolicy: IfNotPresent
        args:
        - --cert-dir=/tmp
        - --secure-port=4443
        command:
        - /metrics-server
        - --kubelet-insecure-tls
        - --kubelet-preferred-address-types=InternalDNS,InternalIP,ExternalDNS,ExternalIP,Hostname
        ports:
        - name: main-port
          containerPort: 4443
          protocol: TCP
        securityContext:
          readOnlyRootFilesystem: true
          runAsNonRoot: true
          runAsUser: 1000
        volumeMounts:
        - name: tmp-dir
          mountPath: /tmp
        resources:
          limits:
            cpu: 300m
            memory: 200Mi
          requests:
            cpu: 200m
            memory: 100Mi
      nodeSelector:
        kubernetes.io/os: linux
        kubernetes.io/arch: "amd64"
---
apiVersion: v1
kind: Service
metadata:
  name: metrics-server
  namespace: kube-system
  labels:
    kubernetes.io/name: "Metrics-server"
    kubernetes.io/cluster-service: "true"
spec:
  selector:
    k8s-app: metrics-server
  ports:
  - port: 443
    protocol: TCP
    targetPort: main-port
---
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
  name: system:metrics-server
rules:
- apiGroups:
  - ""
  resources:
  - pods
  - nodes
  - nodes/stats
  - namespaces
  - configmaps
  verbs:
  - get
  - list
  - watch
---
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
  name: system:metrics-server
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: ClusterRole
  name: system:metrics-server
subjects:
- kind: ServiceAccount
  name: metrics-server
  namespace: kube-system

1.2 安装

  • 安装
kubectl create -f ./components.yaml
  • 查看
pod/metrics-server-6cbcc95697-xckv6       1/1     Running   0          6h26m

service/metrics-server       ClusterIP   10.1.113.17   <none>        443/TCP                  6h26m

deployment.apps/metrics-server       1/1     1            1           6h26m

replicaset.apps/metrics-server-6cbcc95697       1         1         1       6h26m

对比一下我们这钱安装的kube-state-metrics

[root@IoT-M01 yml]# kubectl get all -n kube-system |grep metrics
pod/kube-state-metrics-6497487656-4p9w6   1/1     Running   1          13d
pod/metrics-server-6cbcc95697-xckv6       1/1     Running   0          13m

service/kube-state-metrics   ClusterIP   None          <none>        8080/TCP,8081/TCP        13d
service/metrics-server       ClusterIP   10.1.113.17   <none>        443/TCP                  13m

deployment.apps/kube-state-metrics   1/1     1            1           13d

deployment.apps/metrics-server       1/1     1            1           13m
replicaset.apps/kube-state-metrics-6497487656   1         1         1       13d
replicaset.apps/kube-state-metrics-74b87488f    0         0         0       13d

replicaset.apps/metrics-server-6cbcc95697       1         1         1       13m

可以看到,之前监控启动的kube-state-metrics和本次安装的metrics-server并不是一套服务 。
一个使用了8080端口,一个使用了安全端口443。
虽然镜像不一样,但都是收集k8s资源信息的,不知道是不是用一个就可以,没有测试

2.top命令使用示例

2.1 查看pod资源

[root@devops-master ~]# kubectl top pod -n iot-test-03
NAME                             CPU(cores)   MEMORY(bytes)
apigw-iot-85584cf578-ffr9d       1m           35Mi
apigw-iot-85584cf578-j5bg9       1m           43Mi
apigw-iot-85584cf578-vs4f6       1m           45Mi
emqx-iot-0                       2m           173Mi
emqx-iot-1                       3m           143Mi
emqx-iot-2                       3m           139Mi
monitor-iot-67857b5d65-5gwxd     1m           40Mi
monitor-iot-67857b5d65-p2gjx     1m           47Mi
monitor-iot-67857b5d65-vgl92     1m           33Mi
msgroute-iot-6c4d676c5d-6n6jp    1m           11Mi
msgroute-iot-6c4d676c5d-7grgx    1m           17Mi
msgroute-iot-6c4d676c5d-q4k87    1m           14Mi
mysql-iot-8dflr                  1m           251Mi
redis-iot-58498b5dc8-j5w8g       2m           13Mi
remotectl-iot-74d59ff47-6r9fd    1m           23Mi
remotectl-iot-74d59ff47-r42gn    1m           27Mi
remotectl-iot-74d59ff47-s2c7k    1m           33Mi
remoteops-iot-679465fd48-kn2l8   1m           28Mi
remoteops-iot-679465fd48-sz8nx   1m           16Mi
remoteops-iot-679465fd48-vsj8v   1m           23Mi
web-iot-ffc9b5fff-4ls9k          0m           9Mi
web-iot-ffc9b5fff-5d457          0m           10Mi
web-iot-ffc9b5fff-g54rx          0m           5Mi

2.2 查看node资源

NAME             CPU(cores)   CPU%   MEMORY(bytes)   MEMORY%
b9-node02        118m         5%     1205Mi          32%
b9-node3         80m          2%     2321Mi          14%
devopsnode01     186m         2%     6569Mi          41%
es-node32cuogf   325m         2%     6866Mi          21%
master01         244m         3%     17915Mi         56%

2.3 简单的监控页面

注意:此处仅是一个示例,不具有生产意义,真实场景还是要接正经监控的

  • 写一个脚本将将数据写入nginx页面
#!/bin/bash
for ((i=0;i<=58;i++))
do
  kubectl top -n $1 pod > /usr/local/nginx/build/$1.txt
  echo "----------date-------------" >> /usr/local/nginx/build/$1.txt
  date "+%Y-%m-%d %H:%M:%S" >>  /usr/local/nginx/build/$1.txt
  sleep 1
done
  • 设置定时任务
*   *   *  *  *  bash /usr/local/script/nginx/kube-top.sh crust-framework
  • 查看结果
    在这里插入图片描述

<think>好的,我现在需要帮助用户了解如何在Kubernetes中部署配置metrics-server。根据用户提供的引用内容,我需要先整理相关信息,并确保回答符合系统级指令中的要求,比如使用正确的中文回答、生成相关问题,以及正确引用参考文献。 首先,用户提到了几个引用,其中引用[1]提到了部署metrics-server命令:kubectl create -f metrics-server/deploy/1.8+/。这可能涉及到直接从官方仓库部署。引用[2]详细说明了Metrics Server的作用,包括它是核心监控数据的聚合器,默认不部署,需要开启API Aggregator,并且依赖kubelet的Summary API。此外,安装前需要确保kube-apiserver的API Aggregator已启用,这点很重要,否则metrics-server可能无法正常工作。 引用[5]提到在部署metrics-server之前需要安装网络插件存储插件,这可能是因为某些环境需要这些组件才能正常运行metrics-server。不过用户的问题主要集中在metrics-server的部署配置上,所以可能需要重点讲解如何解决常见问题,比如证书验证或网络问题。 接下来,我需要考虑用户可能的安装步骤。根据引用[1],直接使用官方提供的YAML文件部署是最简单的方法,但可能需要修改其中的参数,比如添加--kubelet-insecure-tls来跳过证书验证,尤其是在测试环境中。引用[2]提到需要开启API Aggregator,这可能涉及到修改kube-apiserver的配置,添加相关参数,但如果是通过kubeadm安装的集群,可能已经默认开启,用户需要确认这一点。 然后是关于配置的方面,比如如何调整metrics-server的采集间隔,资源限制,或者配置TLS。引用[4]中提到了创建ServiceAccountSecret,这可能与权限配置相关,但metrics-server可能需要特定的RBAC权限,所以需要确保部署文件包含正确的ClusterRoleClusterRoleBinding。 监控部分,部署完成后,用户可能需要使用kubectl top命令来查看资源使用情况,或者通过Kubernetes Dashboard集成,如引用[2]中提到的Dashboard依赖Metrics Server的数据。 常见问题方面,用户可能会遇到metrics-server无法启动,或者无法获取指标的问题。这时候需要检查日志,查看是否有证书错误,或者网络策略是否阻止了metrics-server与kubelet的通信。引用[3]提到集群版本是v1.20.15,可能需要确认metrics-server的版本是否兼容该Kubernetes版本。 最后,生成相关问题时,需要考虑用户可能进一步想了解的内容,比如如何集成到监控系统,如何进行高级配置,或者如何验证metrics-server是否正常工作。 总结回答结构:安装部署步骤、关键配置说明、监控方法、常见问题处理,然后生成相关问题。同时,确保所有引用正确标注,比如开启API Aggregator的部分来自引用[2],部署命令来自引用[1]等。需要注意使用正确的LaTeX格式,比如行内公式用$...$,独立公式用$$...$$,但在这个回答中可能数学公式较少,主要关注代码块配置示例。</think>### Metrics-Server 的部署与配置 #### 1. **安装部署** Metrics-ServerKubernetes 集群的核心监控组件,用于聚合资源使用指标(如 CPU、内存)。以下是部署步骤: **步骤 1:启用 API Aggregator** 确保 `kube-apiserver` 已启用 API Aggregator(默认情况下,kubeadm 部署的集群可能已开启)[^2]。检查参数是否包含: ```bash --enable-aggregator-routing=true ``` **步骤 2:部署 Metrics-Server** 使用官方提供的 YAML 文件部署(需适配 Kubernetes 版本): ```bash kubectl apply -f https://github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml ``` 若需跳过证书验证(测试环境),在部署文件中添加以下参数到容器命令: ```yaml command: - --kubelet-insecure-tls ``` #### 2. **关键配置说明** - **资源限制**:调整 Metrics-Server资源请求限制,防止资源不足: ```yaml resources: requests: cpu: 100m memory: 200Mi ``` - **采集间隔**:默认采集间隔为 60 秒,可通过 `--metric-resolution` 参数调整。 - **网络策略**:确保 Metrics-Server 可以访问各节点的 `kubelet`(默认端口 10250)。 #### 3. **监控验证** 部署完成后,验证功能是否正常: ```bash kubectl top node # 查看节点资源使用 kubectl top pod -n kube-system # 查看 Pod 资源使用 ``` 若输出指标数据,则说明部署成功。 #### 4. **常见问题处理** - **指标无法获取**:检查 Metrics-Server 日志: ```bash kubectl logs -n kube-system metrics-server-xxxxxx ``` 常见错误包括证书不匹配或网络不通,可通过 `--kubelet-insecure-tls` 或调整网络策略解决。 - **版本兼容性**:确保 Metrics-Server 版本与 Kubernetes 兼容(例如 v1.20.x 集群建议使用 Metrics-Server v0.5+)[^3]。 --- ###
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

玄德公笔记

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值