我们知道, 根据国际标准化组织 定义 ,网管软件 有五大功能 ,分别是故障管理,计费管理,配置管理,性能管理和安全管理。当然市场上的产品对这些模块可能是选择性的实现,但是一般来说,故障管理和性能管理是网络管理中的最主要的组成部分,也是各类网管产品都提供的核心功能 。故障管理和性能管理功能中最重要的又是故障和性能的预警,一旦预警功能失效,出了真正的故障之后,损失已经造成,虽说亡羊补牢犹未晚,但总不如在故障出现之前,性能下降之前解决问题来的更有价值,损失更小。

预警功能是如此重要,大多数的软件也在这块上下足了功夫,随着对网管的不断深入的理解,预警策略的配置也越来越灵活,除了报警阀值的自定义配置之外,很多网管产品都加入了报警时段、报警频次、报警方法、报警级别等概念,并可以将这些参数进行灵活的配置,单纯的从技术上来说,这样灵活的配置已经可以让网管人员任意的进行配置了,可以满足几乎所有的应用场合。

然后,随着网管应用的深入,很多网管人员发现这种报警阀值的配置方法太繁琐了,不进行配置的话网管软件产生的网络事件又太多,从而导致网管软件不能真正帮助网管人员减轻日常网管的工作量,久而久之,网管软件中的预警功能就弃而不用了,庞大的网管软件就变成了一个偶尔用来实时监视的工具和领导来参考的一个门面。于是,各网管厂家开始推出“基线预警阀值配置”的概念,通过这个配置向导可以帮助用户快捷地配置好所有的策略。

然而随着网络的快速发展,网络应用的层出不穷,很快这种预警策略配置的设计方法变得不再有效。网管人员发现,上个月还有效的预警策略可能在这个月就已经变得无效了。那么如何才能更有效地适应这种应用场景下的预警管理呢?“基线报警”的概念就这样被提出来了,基线报警的核心是通过日基线/周基线/月基线等概念结合一定的算法来动态生成当前的报警阀值,而网管软件本身无须进行相应的报警阀值配置,大大减轻了网管人员的阀值配置难度,有效地提升了网络事件报警的正确性。

从上面我们也可以看出,网管软件中的预警配置这个功能从最早的单一阀值配置,逐步发展到灵活的预警策略配置,再发展到基线预警阀值配置,到现在流行的基线报警。一步一步地更好地满足了网管中对故障管理和性能管理更有效管理的需求。如下图所示:

闃胯吹璋圛DC