在二十世纪六十年代,服务品质协议( service-level agreement )( SLA )是用于达到已定义的服务品质和响应服务问题的一般操作程序,而这些服务问题是用户组织在购买或租用大型机上的机器时间时就已经同意过的。 超大型计算机( big iron )是缺省的企业系统,其它任何技术的处理能力都无法与它相比。当客户机/服务器和网络桌面系统进入计算机世界时,人们就构思出了分布式网络系统这个概念。这些系统后来发展成了跨网络运行企业资源规划( ERP ),供应链管理( SCM )和客户关系管理( CRM )系统的企业范围的系统。

 

在这个发展过程中,企业对因特网的依赖已经使得公司的应用程序套件的网络延迟影响越来越明显。同时,用户(也就是客户)已经委托一定品质的服务质量保证相关的可用性、可靠性和响应时间以确保业务运转不被中断,并且依赖外部服务提供者来提供应用程序、因特网、网络,受管服务和其它服务。结果, SLA 变得更复杂,范围更广,一个用户可以有与不同提供者签定的几个 SLA 。反过来,提供者自己的 SLA 也可以是与其它提供者签定的,每个 SLA 都有一套不同的需求、衡量标准和例外情况。

 

SLA 是服务提供者和客户之间的一个正式合同,用来保证可计量的网络性能达到所定义的品质。 SLA 为服务提供者提供了一种在当今多变而又竞争激烈的市场中胜过对手的方法。服务提供者可能是一个国内的 IT 组织、一个应用程序服务提供者( ASP )、一个网络服务提供者( NSP )、一个因特网服务提供者( ISP )、一个受管服务提供者( MSP )或者任何其它类型的服务提供者。

 

SLA 可以非常笼统或者极度详细,它一般都包含出现故障时服务提供者和客户应采取的步骤。服务提供者保证它提供的服务在一定百分比的时间内(例如, 99.9% )是可用的。提供者还能够强制向客户通知 SLA 当机时间的最长和平均响应时间,或者在网络接口发生改变之前的最长和平均响应时间,并利用基于因特网的工作流自动化、分发和报告技术。如果经过指定的一段时期后提供者无法达到所定义的性能品质,客户就可以获得一些权利和赔偿。各个 SLA 的权利、赔偿和例外情况是不同的。客户还同意接受协议一般条款的指定例外情况。

 

在每个 SLA 中都必须精确定义服务品质;否则各方关于 SLA 将以哪种品质衡量什么服务或性能标准将无法达成一致。例如,一个客户可能认为一个双方同意的服务品质将衡量网络 A 、网络 B 和网络 C ,同时后两者连接到第一个,而服务提供者却认为它只衡量网络 A 。还有一点很重要的是正常运行时间可用性百分比的小数位数:例如,一年中的当机小时数和当机天数比, 99.999% 的正常运行时间所允许的当机时间比 99.9% 的正常运行时间所允许的当机时间还少。 SLA 应该为客户包含进一个退出条款;当因为不能圆满解决经常发生的可用性、可靠性和安全性问题而使客户的业务运转频繁中断时,客户希望他有终止协议的权利。

 

象任何协议或保险单一样, SLA 通常会指定其条款中的例外情况。 IT 服务的 SLA 应该包含关于例外情况的详细信息。我将随意将它们分为四类:故障、不受服务提供者直接控制的问题、拒绝服务和预订的维护。只要客户公司可以得到当机期间的适当赔偿,还可以添加其它一些例外情况来适应提供者的情况。通过在 SLA 中包含进例外情况,提供者可以在出现问题或网络损耗时免负责任。另一方面,如果竞争的服务提供带有极少例外情况的 SLA ,客户可以选择那些在业务运转中提供更长正常运行时间并且有更好的服务保障的协议。即使 99.5% 99.9% 99.999% 这几个正常运行时间可用性保证之间的差别也可以影响选择 SLA 的决策者。

 

我们去细化 SLA ,去定义 SLA ,写明例外情况,如同去餐馆吃饭享受到的服务一样,我们正是通过 SLA 去购买有保障的 IT 服务。对甲方而言, SLA 可以降低风险,明确厂商、服务提供商、供应商要承担的责任;对乙方而言, SLA 是对甲方的承诺,按照 SLA 菜单提供相应的有偿服务,确保服务持续有效。风险是不确定的,而 SLA 是去消除不确定的风险,机房的 UPS 电源、空调、服务器和网络设备,都要有维保合同,厂商提供 5*7 或是 7*24 服务,正是由于 SLA 合同的执行来确保服务的品质。用户的期望值从 SLA 得出的, SLA 承诺提供 KFC 汉堡,最后供应的是必胜客披萨,那么用户的期望值大大满足,反之,给用户的是麦当劳的猪柳蛋汉堡,用户感觉吃亏了,对服务多半不满意。我们给用户提供 SLA 的同时,传达给用户 SLA 能够达到什么样的级别,让用户能够清楚付费的 SLA 价值多少, 3 9 5 9 服务支持差别很大,最终达成双赢。