自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

DevOps 教练

刘老师的博客

  • 博客(11)
  • 收藏
  • 关注

原创 最简化 Elasticsearch & Kibana & Filebeat 安装说明

本文描述如何搭建一套具备用户名和密码安全认证的 Elastic Stack 系统,并开始使用 Filebeat 的基础模块实现分布式的日志收集。安装单节点 Elasticsearch 服务器,启用用户名和密码安全认证,并创建 TLS 数字证书备用 安装 Kibana 服务器,并配置与 Elasticsearch 服务的连接 安装和配置 Filebeat 代理程序,并配置 system 和 auditd 模块 使用 Kibana 监控 Filebeat 所采集的系统日志,并监控系统的状态为了使你也

2020-08-12 09:38:35 277

原创 腾讯云下部署 Elastic Stack 各种 Beat 的最佳实践

概述使用 Elastic Stack 的各种 Beats 模块可以彻底的终结在服务器上手工捞日志查指标的扭曲实践。利用腾讯云提供的 Elasticsearch 服务,可以轻松搞定大规模云环境的运维。本文一次性的帮你梳理清楚了,必备的基础操作,确保你能用 Elastic Stack 安全、稳定和扩展的持续监控你的生产环境。创建 ES 集群登录腾讯云服务控制台,查询并进入 Elasticsearc 服务,点击新建按钮,创建 Elasticsearch 集群。如下图所示。集群配置说明:.

2020-08-12 09:36:32 361 1

翻译 《2020 年 SRE 报告》BY CATCHPOINT

2020 年是不寻常的疫情年,所有行业都受到了巨大的影响, SRE 纯分布式工作方式的转型也是本报告的亮点之一。报告从 4 个方面详细介绍了疫情年中 SRE 的众生相。本报告出自:https://pages.catchpoint.com/2020-sre-report本文是个人学习的结果,非 Catchpint 官方出品,观点尽量与官方保持一致,但个别地方可能难免会出现偏差,有任何质疑请参考原文,或者与我交流。概要SRE 调查贡献者Catchpoint 要特别感谢 Sanjeev Sha

2021-03-01 20:54:23 665

原创 DevOps Coach 周刊 #6

宕机上一周新发的宕机事故。近期全球重大宕机事故的分析总结、事后回顾。May your queries flow and your pagers stay silent.–Dave, Betsy, Niall, Stephen, and Ken上周新发事故Zoom 无法开始和加入会议, 官方报道 https://status.zoom.us/incidents/1z2lrf4nrv8pSlack 多个功能模块服务降级,甚至无法使用,官方:https://status.slack.com

2020-08-31 13:31:21 704

原创 Elasticsearch 3 节点集群搭建 (7.9.0)

最近发布的 Elastic Stack 7.9 ,带来了很多新的特性。Elastic Agent 统一集成数据采集代理是一大亮点。另外还看增加了企业搜索、端点安全防护等组件。Ingest Manager 统一 Beat 配置管理功能让我们向 SaaS 风格的监控工具又迈进了一步。由代理端自行注册到后端,在后端统一纳管所有被管理服务器,将是一种以后非常通用的模式。这样做的好处是:将数据采集端点的配置工作量和复杂度降低到最低。Beats 的各种相关独立模块也在平行的发布,这种双轨模式也可以让用户更弹性的做出选择

2020-08-27 15:47:36 1399

原创 DevOps Coach 周刊 #5

宕机上一周新发的宕机事故。近期全球重大宕机事故的分析总结、事后回顾。May your queries flow and your pagers stay silent.–Dave, Betsy, Niall, Stephen, and KenEquinix 重大电力故障让数据中心客户大发雷霆关于 Equinix :Equinix 是全球领先的数据运营商,目前在美洲、亚太、欧洲及中东 14 个国家(地区)的 31 个市场运营着 94 个国际业务交换。消息来源 CBR https://w

2020-08-25 17:47:34 516

原创 DevOps Coach 周刊 #4

宕机上一周新发的宕机事故。近期全球重大宕机事故的分析总结、事后回顾。May your queries flow and your pagers stay silent.–Dave, Betsy, Niall, Stephen, and Kent新闻项目发布速递Azure Functions 的 PowerShell 7 支持现在是 GA,如果在 PowerShell 中编写无服务器函数对你有吸引力。Go 1.15 - 流行的编程语言。AWS Glue 2.0 - AWS 上的 E

2020-08-21 09:09:50 174

原创 Beats 摄入数据的最佳实践

本文概要:配置 ES 3 节点全加密,Kibana 的 SSL 加密配置,Beats 的高可靠性加密传输,用 RBAC 怎样把权限控制到最小,在配置文件中消除明文密码,这些你都做到了么?如何保证安全、能适应和可扩展的配置 Elastic Stack 技术栈,让我们从 Bests 的角度开始讲解。前言本文使用的软版本:Elastic Stack 7.8.0 macOS 10.15.5 Vagrant 2.2.9 VirtualBox 6.0 CentOS 8.0下面的配置和测试过程基于以

2020-08-12 09:45:52 343

原创 DevOps Coach 周刊 #1

新闻又到了一年一度的时间。定期的Puppet Devops状态调查已经开始。今年的重点是变革管理、持续交付和自服务平台之间的关系。https://polls.onresearch.net/xsurvey/20JT028/20JT028T1/Survey.aspx?ckie=true文档和设计在构建强大的系统中起着至关重要的作用。这篇文章探讨了为什么设计文档是有用的,以及它们应该包含什么样的内容。https://www.industrialempathy.com/posts/design-docs-a

2020-08-11 20:35:52 485

原创 DevOps Coach 周刊 #2

宕机上周全球重大宕机事故清单。Facebook具英媒体报道:7月 28 日 12:20pm, Facebook, Instagram 和 WhatsApp 这三款用户的一半以上的用户,无法加载出页面,无法正常使用服务。 Facebook 官方还没有关于这次事故的回应。实际上整个欧洲大陆,特别是葡萄牙和西班牙的故障更要严重一些。原因不明。影响范围:London, Birmingham 和 Manchester.来源: https://metro.co.uk/2020/07/28/facebook-

2020-08-11 20:35:07 220

原创 DevOps Coach 周刊 #3

宕机上一周新发的宕机事故。近期全球重大宕机事故的分析总结、事后回顾。上周新发宕机事故Discord 这个值得注意的是,它涉及到谷歌云平台中所谓的 "吵闹邻居 "情况。https://discord.statuspage.io/incidents/bnv0wbddzz2xSlack 更新缓存基础架构的坑。从2020年7月23日晚上9:00 PDT到2020年8月1日下午5:17 PDT,客户在使用各种API端点时可能会出现滞后或故障。我们于7月29日开始调查这一问题,并将这些问题追溯到最近对我

2020-08-11 20:34:08 371

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除