SRE附录F-生产环境会议记录示范

日期

2015-10-23

参与者

agoogler、clarac、docbrown、jennifer和martym

公告

  • 大型事故(#465),造成错误预算耗尽

之前的待办事项评审

  • 确保山羊传送器可以用于传送牛奶

    ——质子加速中的非线性特质可以预知了,应该可以在几天内解决准确性问题

事故回顾

  • 新韵文的发现(事故465)

    —— 12.1亿个请求在连锁故障与潜伏先bug的共同作用下丢失,索引中不存在新的韵文和未预料的流量

    —— 文件描述符的bug以修复,已经部署到生产环境

    —— 调研使用flux capacitor进行负载均衡,利用负责抛弃来预防再发生

    —— 错误预算已经耗尽,生产环境的更新将会停止一个月。除非docbrown能够以该极为罕见、不可预知为理由获得管理层批准

  • AnnotataionConsistencyTooEventual:本周告警5次,可能是由于bigtabale跨区域的复制延迟导致

    —— 调查仍在进行,见bug 4898200

    —— 最近不会有修复,会提高阈值以减少无效告警的次数

非紧急告警回顾

  • 没有

监控系统修改/静音

  • AnnotataionConsistencyTooEventual,可以接受的延迟阈值从60s提高到180s

资源

  • 处于新韵文事故时借用了一些资源,会在下周下线多余的容量以退还容量
  • 目前的利用率是 CPU 60%、RAM 75%、DISK 44%

关键服务指标

  • OK 99 百分比延迟:88ms < 100ms SLO目标(过去30天)
  • BAD 可用性:86.95% < 99.99 SLO目标 (过去30天)

讨论/项目更新

  • 项目Molere下两周发布

新的代办事项

  • TODO (martym):提高AnnotataionConsistencyTooEventual的阈值
  • TODO(docbrown):将实例数量复原,退还资源
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SRE(Site Reliability Engineering)是一种将软件工程和运维运营原则相结合的实践方法,旨在提高系统的可靠性、可扩展性和可维护性。Rancher是一个开源的容器管理平台,可以帮助用户轻松部署和管理容器化应用。根据引用\[1\],可以使用以下命令在Docker容器中部署Rancher: docker run -d --restart=unless-stopped --name=myrancher -p 18080:80 -p 18443:443 --privileged -v /var/server/rancher:/var/lib/rancher -v /var/rancher/log:/var/log/log rancher/rancher:stable 需要注意的是,根据引用\[2\],在安装Rancher时需要确保系统软件环境与Rancher的环境矩阵要求匹配。可以通过查看容器启动日志(使用docker logs -f rancher命令)来确认Rancher是否成功启动。一旦启动成功,就可以通过浏览器访问Rancher的UI界面。 另外,根据引用\[3\],还可以使用kubectl命令来导入Rancher的配置文件,例如: kubectl apply -f https://rancher.kkk.cn/v3/import/q9zxs2hp6j2d8hvfpw5trsf5wzz8lhhbffd8m74qvdm6rrjpg5mzr7_c-m-k7lq9m4t.yaml 这样可以更灵活地管理Rancher的配置。 #### 引用[.reference_title] - *1* *3* [Rancher部署](https://blog.csdn.net/u012824078/article/details/128084046)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [rancher 部署](https://blog.csdn.net/ljx1528/article/details/126418845)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值