![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
可观测性
文章平均质量分 93
夜莺开源监控
Nightingale | 夜莺监控,一款先进的开源云原生监控分析系统,Prometheus Enterprise Edition,Prometheus企业级版本,隶属中国计算机学会开源发展委员会
展开
-
在 Kubernetes 里部署 JMX Exporter 监控 Java 应用
在这篇博客中,我们介绍了在 Kubernetes 集群上实现 JMX Exporter 的步骤。此外,在导出器 Configmap 中,您可以为 JMX Exporter 添加其他过滤器设置,以收集其他指标。原文:https://devopscube.com/jenkins-architecture-explained/译文:https://flashcat.cloud/blog/jenkins-architecture-explained/译者:巴辉特。原创 2024-07-31 14:54:51 · 349 阅读 · 0 评论 -
7 张图,彻底讲透 Prometheus 架构原理
TargetsExportersPromQL让我们详细看看每个组件。这解释了 Prometheus 架构的主要组件,并将给出 Prometheus 配置的基本概述,您还可以使用配置做很多事情。每个组织的需求会有所不同,并且 Prometheus 在不同环境(例如 VM 和 Kubernetes)中的实现也有所不同。如果您了解基础知识和关键配置,您就可以轻松地在任何平台上落地它。本文翻译自这里。运维监控实战笔记。原创 2024-07-22 17:23:05 · 686 阅读 · 0 评论 -
教你一招,告警恢复时如何拿到恢复时的值?
Prometheus 生态的监控系统,在告警恢复消息中难以拿到恢复时的值,Nightingale 中提供了一个较为简单的方法,值得尝试原创 2024-06-12 15:30:26 · 729 阅读 · 0 评论 -
Prometheus 监控平台组件深度讲解
Prometheus 的重要性和流行度已经无需多言。直入主题,本文对 Prometheus 监控平台的各个组件做深度讲解,希望能帮助读者更好地理解 Prometheus。原创 2024-05-11 10:49:35 · 669 阅读 · 0 评论 -
你唯一需要的是“Wide Events”,而非“Metrics、Logs、Traces”
Charity Majors 的这句话可能是对科技行业当前可观察性状态的最好总结——完全的、大规模的混乱。大家都很困惑。什么是 trace?什么是 span?一行日志就是一个 span 吗?如果我有日志,我还需要 trace 吗?如果我有很好的 metric,为什么还需要 trace?诸如此类的问题不胜枚举。Charity 与 Honeycomb 可观测系统中的其他杰出人士一起,一直在努力解决这些问题。原创 2024-04-26 11:53:00 · 991 阅读 · 0 评论 -
可观测性与传统监控的区别和联系
可观测性(Observability)是一种软件开发和系统构建的哲学,是对系统内部状态及行为的度量和推断能力,通常包括日志、指标、链路追踪等多个度量维度。也就是说,在软件开发和运维领域中,可观测性是指对于一个复杂的系统,能够通过监控、日志、指标、追踪等手段,快速地发现、诊断、解决问题的能力。原创 2024-01-16 14:58:56 · 1017 阅读 · 0 评论 -
理想的监控系统到底是什么样的?
本文是从监控系统的构建角度,从采集->传输->存储->可视化->告警->事件分发不同阶段做了简要分析,给了一些可能的解法,希望对大家有帮助。如果你对监控系统的构建有更好的想法,欢迎留言交流。原创 2023-12-18 12:12:16 · 942 阅读 · 0 评论 -
ClickHouse + ClickVisual 构建日志平台
ClickVisual 官方宣扬的核心功能是:轻量级日志查询、分析、报警可视化平台。报警这块有更好的方案,我这里主要尝试一下接入日志、存储、查询日志的整个流程。文档:https://clickvisual.net/代码:https://github.com/clickvisual/clickvisualClickVisual 的整体思路设计挺巧妙的,不过业界使用 ClickHouse 存储日志,大都是使用的双 array 存储动态字段。你们公司是如何做的呢?原创 2023-12-01 10:00:00 · 1082 阅读 · 0 评论 -
可观测性建设实践之 - 日志分析的权衡取舍
本文介绍了稳定性保障中日志分析系统建设面临的问题、挑战、需求和建设中的权衡取舍。并介绍了 Flashcat 如何解决这些问题,做到效果和成本最佳,也最具落地的可行性。原创 2023-11-25 09:47:40 · 862 阅读 · 0 评论 -
Grafana 开源了一款 eBPF 采集器 Beyla
Beyla 目前还不太稳定,还有很多功能没有完成。不过可以尝鲜研究了。可观测性整套技术栈搞起来还挺费劲的,如果您想建设这套技术栈,欢迎来和我们聊聊,我们提供这方面的咨询和商业产品,详情了解:快猫星云 Flashcat | 为了无法度量的价值 | 开源监控 | 夜莺监控 | 可观测平台 | 运维监控 | IT监控快猫星云(官网),支持云原生监控、混合云监控、多云统一监控,解决云原生架构、混合云架构下统一监控难、故障定位慢的问题t=N7T8。原创 2023-09-27 17:09:55 · 1598 阅读 · 0 评论 -
使用 eBPF 在云中实现网络可观测性
可观测性是一种了解和解释应用当前状态的能力,也是一种知道何时出现问题的方法。随着在 Kubernetes 和 OpenShift 上以微服务形式进行云部署的应用程序越来越多,可观察性受到了广泛关注。许多应用程序都有严格的承诺,比如在停机时间、延迟和吞吐量方面的 SLA,因此网络层面的可观测性是一项非常必要的功能。网络层面的可观测性由不同的编排器提供,有的是内置支持,有的是通过插件和 operator 提供。最近,eBPF(扩展的伯克利数据包过滤器)因其性能和灵活性成为在终端主机内核实现可观察性的热门选择。原创 2023-08-25 08:30:00 · 264 阅读 · 0 评论 -
使用 OpenTelemetry 构建可观测性 06 - 生态系统
OpenTelemetry 是一个非常优秀的项目,它为我们开发的软件抽象出一套实现可观测性的方案。通过使用 OTel ,我们能够获得最大化的可观测能力,而无需进行任何代码更改就能发现潜在的问题。我强烈推荐您深入了解 OpenTelemetry 项目!一旦您开始使用,您将会爱不释手!方法论:面向故障处理的可观测性体系建设白皮书:事件 OnCall 中心建设方法好工具:FlashDuty - 一站式告警处理平台:告警降噪、排班OnCall。原创 2023-08-24 09:31:10 · 101 阅读 · 0 评论 -
使用 OpenTelemetry 构建可观测性 05 - 传播和行李(Propagation & Baggage)
在 OpenTelemetry 中通过使用传播和行李,很好的解决了“分布式链路追踪”中“分布式”的问题。这样可以帮助您获取更有价值的链路追踪数据!方法论:面向故障处理的可观测性体系建设白皮书:事件 OnCall 中心建设方法好工具:FlashDuty - 一站式告警处理平台:告警降噪、排班OnCall。原创 2023-08-24 09:12:04 · 139 阅读 · 0 评论 -
使用 OpenTelemetry 构建可观测性 04 - 收集器
OpenTelemetry Collector 是一个功能强大的工具,它的一大优点是您可以创建自己的收集器分发版来满足您的需求。在我看来,这种灵活性使得 OpenTelemetry Collector 在 OpenTelemetry 生态系统中具备重要作用。方法论:面向故障处理的可观测性体系建设白皮书:事件 OnCall 中心建设方法好工具:FlashDuty - 一站式告警处理平台:告警降噪、排班OnCall。原创 2023-08-21 17:25:38 · 212 阅读 · 0 评论 -
使用 OpenTelemetry 构建可观测性 03 - 导出
很棒前进了一步!按照上面步骤实现了,通过 API 获取了遥测数据,并将其从当前组件中被发送到一个导出器,并向其中添加了一些元数据(资源)!接下来我们将了解如何使用 OpenTelemetry 收集器来处理这来数据。方法论:面向故障处理的可观测性体系建设白皮书:事件 OnCall 中心建设方法好工具:FlashDuty - 一站式告警处理平台:告警降噪、排班OnCall。原创 2023-08-17 19:36:57 · 1296 阅读 · 0 评论 -
使用 OpenTelemetry 构建可观测性 02 - 埋点
埋点是 OpenTelemetry 的核心。它定义了如何去收集哪些遥测数据,我们既可以选择手动埋点还可以利用现成的自动埋点代码库。在下一篇博文中,我们将了解 OTel SDK 是如何处理这些数据!方法论:面向故障处理的可观测性体系建设白皮书:事件 OnCall 中心建设方法好工具:FlashDuty - 一站式告警处理平台:告警降噪、排班OnCall。原创 2023-08-16 14:16:10 · 243 阅读 · 0 评论 -
使用 OpenTelemetry 构建可观测性 01 - 介绍
OpenTelemetry 是几年前 OpenCensus 和 OpenTracing 合并的产物。从那时起,OpenTelemetry(也简称为 "OTel")就很好地将自己定位为在现代软件世界中获取遥测数据且厂商中立的方法。很多人会说 OpenTelemetry 是可观测性的未来,根据我的经验和接触,我倾向于同意这种说法。希望通过上面介绍让您现在对 OpenTelemetry 已经有所了解,知道它由哪些组件构成,以及我们将如何在本系列的其余部分深入实施。这仅仅是个开始!原创 2023-08-15 17:15:04 · 187 阅读 · 0 评论