云原生时代的监控明星 – 夜莺

云原生时代的监控明星 – 夜莺

如果想要更多原创干货,欢迎关注wx: 云原生知识栈

引言

在云原生时代,随着业务的不断扩展和技术栈的日益复杂,对于监控系统的需求也日益增长。传统的监控方案往往难以满足现代企业的高可用、高性能要求。而夜莺监控(Nightingale),作为一款先进的开源云原生监控分析系统,以其All-In-One的设计理念,为企业带来了全新的解决方案。今天,我们就来一起探索夜莺监控的魅力所在。他到底为我解决了哪些问题?

夜莺监控简介

夜莺监控是一款由国内团队开发的开源云原生监控系统,它采用了All-In-One的设计模式,集数据采集、可视化、监控告警、数据分析于一体,与云原生生态紧密集成,为用户提供了一站式的监控解决方案。无论是在私有云、公有云还是混合云环境中,夜莺都能提供开箱即用的企业级监控分析和告警能力。

帮我解决了哪些问题?

1. 实现统一告警管理

夜莺天生支持多种时序库的对接,如:Prometheus、VictoriaMetrics、Thanos、Mimir、M3DB、TDengine 等多种时序库,

在我的场景中,存在大量混部,私有云的Prometheus集群,这让我的监控告警带来一定的挑战。使用夜莺让我释放了双手。提高了效率,

具体感受如下:

  • 不在需要管理Prometheus里面的Rules
  • 不在需要维护Prometheus系的Alertmanager
  • 不在需要维护那么多集群的告警渠道及组件
  • 不在需要为每一个用户配置不一样的告警规则
  • 有了分组分级告警能力
  • 有了统一的监控告警Oncall能力
  • 中心化接管全集群Prometheus服务管理
  • 告警聚合,清晰知道哪个Prometheus集群再哇哇叫
2. 统一日志查看聚合能力

想必大佬们也有类似的场景,各集群有一套自己的日志系统,如ELK,Loki等,分别接入各项目用户使用,那么每套日志系统切换着看,是不是很麻烦?
So,他来了!!!

开源版本目前支持接入 Prometheus Like(Prometheus、VictoriaMetrics、Thanos、M3 等兼容 Prometheus 查询接口的数据源)、ElasticSearch、Loki、TDEngine 等数据源类型,但是这只是我目前接入较少的一部分。

针对这部分功能给我的感jio

  • 下回再问我要日志系统链接–> 出门左拐
3. 告警管理订阅能力

如果你有100+Prometheus 集群,有100+用户关注告警信息,兄台如何应对?


上夜莺:

内置支持多种告警规则,可以扩展支持常见通知媒介,支持告警屏蔽/抑制/聚合/自愈、告警事件管理。

  • 我给你写好规则,你爱咋收咋收 => 告警订阅
  • 我不会写PromQL,我给你大量内置,还手摸手教你OK?=> 新手模式
  • 我不想写PromQL,想点一下就能看,OK,OK,=> 指标视图
  • 告警太多了,烦死人了,点一下自动屏蔽,或者控制一下通知间隔很累吗? => 告警屏蔽
4. 统一登录

要是你维护的系统,固定一个秘密。来一个人问你一下密码,你能受得了么?

夜莺支持了 OAuth、LDAP、CAS、OIDC 这四种单点登录服务的对接,想要对接某个单点登录服务,直接在页面上配置即可

产品架构:

核心功能亮点

1. 数据采集与整合
  • 广泛的数据源支持:夜莺监控支持多种数据源接入,包括Prometheus、VictoriaMetrics等多种时序数据库,以及日志文件、网络流量等。
2. 可视化与分析
  • 灵活的仪表盘定制:用户可以根据自身需求,自定义创建多样化的仪表板,实现对监控数据的实时展示。
  • 强大的数据分析工具:内置丰富的数据分析功能,支持SQL查询、数据挖掘等功能,帮助用户深入理解业务趋势。
3. 监控告警
  • 智能告警机制:支持基于阈值、异常检测等多种告警规则,可根据不同场景设置告警策略。
  • 多渠道通知:支持邮件、短信、企业微信等多种通知方式,确保问题及时被发现并处理。
  • 运维OnCall灵活机制: 无缝搭配 Flashduty:实现告警聚合收敛、认领、升级、排班、IM集成,确保告警处理不遗漏,减少打扰,高效协同。
4. 权限管理与便捷性
  • 细粒度的权限控制:提供用户管理和权限分配功能,确保每个用户只能访问被授权的数据。
  • 统一登录对接:统一的 SSO 认证、鉴权、用户、团队、业务组管理体系,提供了一个平台底座

最近的新功能

夜莺监控团队持续更新和完善产品,最近推出的版本中新增了一些实用的功能,例如:

  • 全站暗黑主题
  • 新增指标视图,内置上百个 promql,无需手写 promql 即可方便地查看监控数据
  • 新增模版中心,支持创建和修改模板,模版可以在一个地方集中维护和查看
  • 优化边缘机房机器失联告警的实现逻辑,真正做到边缘机房告警自闭环
  • 通知时支持配置过滤标签,避免告警事件中一堆不重要的标签
  • 全局回调地址页面展示优化,增加详尽的文档提示信息
  • 支持通过回调地址直接发送告警信息到钉钉、飞书、企微等
  • 内置集成故障自愈能力,不需要再单独部署 ibex 模块
  • 仪表盘变量支持和本业务组的机器联动,不同业务组组下的仪表盘只展示本业务组内的机器
  • 机器列表和指标视图打通,可以选择多台机器直接看图,无需任何提前配置
  • 告警规则,支持配置恢复时的 Promql,告警恢复通知也可以带上恢复时的值了
  • 支持通过回调地址直接发送告警信息到钉钉、飞书、企微等
  • 支持集成仪表盘,可以将 grafana 的仪表盘集成到夜莺中

部署方式:

准备好MySQL、Redis、K8s集群直接apply就行了,动动手,很快的!!!

https://flashcat.cloud/docs/content/flashcat-monitor/nightingale-v7/install/intro/


希望这篇文章能为你提供有关夜莺监控的一些有用信息。如果你有任何疑问或想要了解更多细节,请随时留言讨论。

如果想要更多原创干货,欢迎关注wx: 云原生知识栈

  • 17
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值