SRE运维揭秘: 企业生产中运维监控的真相

本文分享了作者作为资深运维专家的经验,涵盖了从基础资源监控到Kubernetes服务监控,以及微服务架构下的服务链路监控,强调了如何从0到1建立全面的监控体系来保障业务稳定性和安全性。
摘要由CSDN通过智能技术生成

大家好,我是博哥爱运维,有着十年SRE运维开发经验,从事过全球多个主流云平台的服务架构设计及自动化运维开发工作,在企业中基于gitlab和k8s从零设计过完整的一套CICD流水线架构,曾用shell开发过运维堡垒机系统,用golang开发过云原生K8S堡垒机系统及运维OnCall监控报警中心服务,在云计算、自动化、安全、监控、DevOps运维开发方面有着丰富的实战工作经验。

------> 课程视频同步分享在今日头条B站
这里只作录课时笔记的一些记录,很零散,具体有兴趣大家可以点击上面链接去看公开课视频。

  • 初级运维工程师:知道什么业务场景需要用什么监控软件 ,并且能够部署上线生产使用。

  • 中、高级运维开发工程师:能够结合公司生产业务场景,针对 不同的监控软件做相应运维开发监控层面的开发工作。

  • SRE运维开发工程师:能够站在公司业务架构的视角,上帝视角,开发相应的运维监控平台,统筹管理公司所有的监控体系。

从0到1实现这一套监控体系,从而保障业务服务的稳定性

基础资源监控
zabbix
小米公司
open-falcon
server — agent
编写一些脚本,收集一些特定的监控数据
netdata 秒级 UI页面很漂亮 ,数据 很全

K8S容器化监控
k8s deployment pod ip
prometheus promql

nightingale 夜莺 监控模板很多

服务网络链路监控
监控宝 公有业务服务链路拨测saas
uptime-kuma 开源监控宝,拨测,秒级

K8S普及
资源生命周期事件
kube-eventer 秒级K8S事件监控
falco K8S上安全事件监控
上千个服务POD,上万个

kubectl exec -it xxxxx – bash

微服务
成千上万个服务
skywalking

  • 8
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值