OpenShift 4 - 用内置的Prometheus监控应用

59 篇文章 1 订阅
5 篇文章 1 订阅

OpenShift 4.x HOL教程汇总
说明:本文已经在OpenShift 4.8环境中验证

配置Prometheus环境

  1. 创建内容如下的config.yaml文件,它将在openshift-monitoring项目中创建一个ConfigMap对象,打开“enableUserWorkload”功能。
apiVersion: v1
kind: ConfigMap
metadata:
  name: cluster-monitoring-config
  namespace: openshift-monitoring
data:
  config.yaml: |
    enableUserWorkload: true
  1. 执行命令创建ConfigMap对象。
$ oc apply -f config.yaml
  1. 查看openshift-user-workload-monitoring项目中增加的Pod,这3个Pod就是OpenShift用来对项目级的应用进行监控的Prometheus环境。
$ oc get pod -n openshift-user-workload-monitoring
NAME                                  READY   STATUS    RESTARTS   AGE
prometheus-operator-f787c4fd7-54wmd   2/2     Running   0          11m
prometheus-user-workload-0            4/4     Running   1          11m
prometheus-user-workload-1            4/4     Running   1          11m
thanos-ruler-user-workload-0          3/3     Running   0          11m
thanos-ruler-user-workload-1          3/3     Running   0          11m

部署被监控应用

  1. 创建内容如下的prometheus-example-app.yaml文件,它会在名为monitored-app的项目中创建被监控应用的资源。其中应用级定制的是名为version的监控指标。
apiVersion: v1
kind: Namespace
metadata:
  name: monitored-app
---
apiVersion: apps/v1
kind: Deployment
metadata:
  labels:
    app: prometheus-example-app
  name: prometheus-example-app
  namespace: monitored-app
spec:
  replicas: 1
  selector:
    matchLabels:
      app: prometheus-example-app
  template:
    metadata:
      labels:
        app: prometheus-example-app
    spec:
      containers:
      - image: quay.io/brancz/prometheus-example-app:v0.2.0
        imagePullPolicy: IfNotPresent
        name: prometheus-example-app
---
apiVersion: v1
kind: Service
metadata:
  labels:
    app: prometheus-example-app
  name: prometheus-example-app
  namespace: monitored-app
spec:
  ports:
  - port: 8080
    protocol: TCP
    targetPort: 8080
    name: web
  selector:
    app: prometheus-example-app
  type: ClusterIP
  1. 执行命令创建应用资源,然后确认应用Pod运行情况。
$ oc apply -f prometheus-example-app.yaml
$ oc get pod -n monitored-app
NAME                                      READY     STATUS    RESTARTS   AGE
prometheus-example-app-7857545cb7-sbgwq   1/1       Running   0          81m
  1. 创建Route,然后查看应用的监控指标,确认只有“version”一个指标。
$ oc expose svc/prometheus-example-app -n monitored-app
$ curl http://$(oc get route prometheus-example-app -n monitored-app | awk 'NR==2 {print $2}')/metrics
# HELP version Version information about this binary
# TYPE version gauge
version{version="v0.1.0"} 1

创建收集指标的角色,并为用户赋予该角色

  1. 创建内容如下的custom-metrics-role.yaml文件。
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
  name: monitor-crd-edit
rules:
- apiGroups: ["monitoring.coreos.com"]
  resources: ["prometheusrules", "servicemonitors", "podmonitors"]
  verbs: ["get", "list", "watch", "create", "update", "patch", "delete"]
  1. 创建这个ClusterRole。
$ oc apply -f custom-metrics-role.yaml
  1. 进入OpenShift 控制台的“管理员”视图,进入“用户管理” → “角色绑定”菜单。在确认当前是“所有项目”后点击“创建绑定”按钮。
  2. 在“创建 RoleBinding”页面中先将“绑定类型”设为“命名空间角色绑定(RoleBinding)”。然后为RoleBinding提供“名称”(例如my-role-binding-monitor);再为“命名空间”选择刚刚部署应用的“monitored-app”项目。随后为“角色名称”选择“monitor-crd-edit”;为“主题”(Subject)选择“用户”类型,最后为“主题名称”(Subject Name)提供一个已有的OpenShift用户名(这里使用的是集群管理员)。随后点击“创建”按钮创建项目级RoleBinding对象。
    在这里插入图片描述
  3. 进入OpenShift的“管理员”视图的monitored-app项目,然后切换到“角色绑定”页面。使用“过滤器”选出“Namespace Role Bindings”类型,此时可以看到名为my-role-binding-monitor的RoleBinding对象。
    在这里插入图片描述

设置应用监控指标

  1. 创建内容如下的example-app-service-monitor.yaml文件。它定义了一个ServiceMonitor对象,其中包括监控应用、监控时间间隔等配置。
apiVersion: monitoring.coreos.com/v1
kind: ServiceMonitor
metadata:
  labels:
    k8s-app: prometheus-example-monitor
  name: prometheus-example-monitor
  namespace: monitored-app
spec:
  endpoints:
  - interval: 30s
    port: web
    scheme: http
  selector:
    matchLabels:
      app: prometheus-example-app
  1. 执行命令创建ServiceMonitor对象,然后查看它的状态。
$ oc apply -f example-app-service-monitor.yaml
$ oc get servicemonitor -n monitored-app
NAME                         AGE
prometheus-example-monitor   81m

设置告警规则

  1. 创建内容如下的example-app-alerting-rule.yaml的文件。它创建了一个PrometheusRule对象,该PrometheusRule会在prometheus-example-app应用的version为0的时候发出告警。
apiVersion: monitoring.coreos.com/v1
kind: PrometheusRule
metadata:
  name: example-alert
  namespace: monitored-app
spec:
  groups:
  - name: example
    rules:
    - alert: VersionAlert
      expr: version{job="prometheus-example-app"} == 0
  1. 执行命令,创建PrometheusRule对象。
$ oc apply -f example-app-alerting-rule.yaml

赋予任意指定用户查看监控指标

  1. 缺省情况下,监控的应用指标数据只能是OpenShift集群管理员身份的用户查看到。执行以下命令,让“ANY_USERNAME”用户能查看到monitored-app项目的资源。
$ oc policy add-role-to-user view <ANY_USERNAME> -n monitored-app
  1. 以上命令也可通过进入OpenShift“开发者”视图的“项目”菜单,进入“monitored-app”项目,在“项目访问”页面里完成。点击“添加访问”链接,然后指定“名称”和“角色”即可。例如下图赋予集群管理员“opentlc-mgr”以“View”角色。
    在这里插入图片描述

查看Prometheus监控到的应用定制指标

  1. 在OpenShift的“开发者”视图中进入“监控”菜单,然后切换到“指标”栏目。在“选择查询”下拉框中使用“自定义查询”查询应用指标,然后在“表达式”框中输入“version”,最后回车即可。此时就可以在界面中看到应用定制的监控指标“version”的数值。
    在这里插入图片描述
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
一、prometheus简介 Prometheus是一个开源的系统监控和告警系统,现在已经加入到CNCF基金会,成为继k8s之后第二个在CNCF维护管理的项目,在kubernetes容器管理系统中,通常会搭配prometheus进行监控prometheus支持多种exporter采集数据,还支持通过pushgateway进行数据上报,Prometheus再性能上可支撑上万台规模的集群。 二、prometheus架构图 三、prometheus组件介绍 1.Prometheus Server: 用于收集和存储时间序列数据。 2.Client Library: 客户端库,检测应用程序代码,当Prometheus抓取实例的HTTP端点时,客户端库会将所有跟踪的metrics指标的当前状态发送到prometheus server端。 3.Exporters: prometheus支持多种exporter,通过exporter可以采集metrics数据,然后发送到prometheus server端 4.Alertmanager: 从 Prometheus server 端接收到 alerts 后,会进行去重,分组,并路由到相应的接收方,发出报警,常见的接收方式有:电子邮件,微信,钉钉, slack等。 5.Grafana:监控仪表盘 6.pushgateway: 各个目标主机可上报数据到pushgatewy,然后prometheus server统一从pushgateway拉取数据。 四、课程亮点 五、效果图展示 六、讲师简介 先超(lucky):高级运维工程师、资深DevOps工程师,在互联网上市公司拥有多年一线运维经验,主导过亿级pv项目的架构设计和运维工作 主要研究方向: 1.云计算方向:容器 (kubernetes、docker),虚拟化(kvm、Vmware vSphere),微服务(istio),PaaS(openshift),IaaS(openstack)等2.系统/运维方向:linux系统下的常用组件(nginx,tomcat,elasticsearch,zookeeper,kafka等),DevOps(Jenkins+gitlab+sonarqube+nexus+k8s),CI/CD,监控(zabbix、prometheus、falcon)等 七、课程大纲

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值