监控告警
文章平均质量分 91
嘉为蓝鲸
与大家分享最新IT研发、运维、运营侧资讯
展开
-
企业级运维监控系统体系化建设指南
监控系统的本质是通过发现故障、解决故障、预防故障来为了保障业务的稳定。而要想在企业内实现监控系统的体系化建设落地,需要从以下三个方面着手建设,分别是监控技术体系、监控指标体系、监控管理体系。原创 2022-09-27 17:11:12 · 897 阅读 · 0 评论 -
企业该如何做好日志管理?
2)蓝鲸平台在腾讯内部业务场景的探索其实刚刚展示的这套日志架构,源自腾讯IEG蓝鲸日志平台的数据流示意图。蓝鲸平台在早期就将日志的各类应用场景作为整个自动化运营中的关键环节,并规划建造出了一套适合中大型企业使用的日志平台。直至目前,蓝鲸日志平台已经历经上百次的迭代,在腾讯内部积累了大量的实践经验,支持了上千项业务的日志需求,总结出了不少技术优化举措,在此结合这个话题进行分享总结。3)关键技术优化举措&经验① 采集端统一Agent,用Agent装采集插件的方式来实现日志采集,便于安装管理。...原创 2022-08-14 14:46:24 · 712 阅读 · 0 评论 -
如何进行日志管理?有好用的日志管理软件吗?
近年来,IT系统逐渐呈现海量化和异构化的趋势,企业每天可能会产生上百GB甚至TB级的日志数据,如何实现日志数据的集中化接入,以及保障日志管理的持续拓展性,成为企业日志管理的一大难点。...原创 2022-08-14 14:43:14 · 790 阅读 · 0 评论 -
智能运维探索:有一种多指标异常检测方案,你可能没用过...
各行业信息化程度迅猛发展的今天,各大企业的信息系统也日趋庞大和复杂。为了保证系统的正常运行,企业的运维人员会通过相应的KPI(Key Performance Indicator, 关键性能指标)对系统进行监控。当某些KPI发生异常时,能够及时发出告警,通知相关人员。一、监控告警系统的数据检测现状现有的监控告警系统大部分采用人工设定规则或阈值的方式来实现。在某些情况下,这些方法确实简单有效,但在中大型业务系统中,我们往往会面临更多的KPI数量,更复杂的KPI间的关联关系,以及更多样性的KP原创 2021-12-24 10:52:07 · 1853 阅读 · 1 评论