建议CSDN用5个9的标准要求服务质量

原创 2006年06月17日 18:08:00
最近CSDN的Blog板块不是一般的不稳定,重大故障是屡屡发生。

首先是一次失败的换版,增加了一些无谓的功能,如最新更新,在每个博客里增加一些顶端链接等等。刚上去不久,站点http://blog.csdn.net就不可访问了。CSDN于是回退倒上一个版本,很多数据出现显示丢失现象。

接着不久,又有一次更离谱的问题,访问http://blog.csdn.net居然要求输入Windows的用户认证密码!大概这个时候,CSDN的员工正在现场抢修。

随着这个周末,CSDN的站点又剧慢无比了!点击任何一个Blog都需要10分钟以上才能打开。

这对于提供服务为主要业务的CSDN可以说是企业生存性命攸关的大事故!在我看来,CSDN应该也是列数SaaS(软件作为服务)的企业,SaaS最重要的是什么?是高可用性(High Available),就是让用户始终可以访问到站点和功能。高可用性对SaaS企业就像水对鱼那样的重要!Salesforce公司,一家被认为是SaaS企业中的翘楚,由于2006年初几次事故,尽管客户成长,收入和现金流都非常好,股票却在数月间跌了25%。为什么,因为投资者对企业的Hosting能力产生了怀疑。

对CSDN来说,提高Hosting能力应该是当务之急。作为一个CSDN的多年用户,我在这里提几个建议:

1、少就是多。
产品特性不是越多越好,而是有核心竞争力的特性要稳固易用。少一点特性,多一些易用,是SaaS企业应该奉为圭皋的信条。CSDN的核心客户应该是博友们,留住这些博友就是所谓的产品的粘性(Stick),而产品粘性最重要的就是易用稳定。

2、Blog板块的运作应该围绕Hosting,设定质量指标,如5个9的目标。这里介绍一家国外顶级SaaS公司的运作。
整个企业的由三大板块组成:Marketing,R&D和Hosting。Marketing负责研究市场,提出新特性,销售;R&D是做产品;Hosting则负责把R&D研发出来的产品发布到Production环境中去以及各种各样的监控和维护。这里特别要说明的是,Hosting部门由CIO领衔,人员配备齐全,占公司总人数近1/3,资金充足,是最重要的核心部门之一。就像是电信公司的运行部门一样。

而R&D部分呢,研发的产品是不能随便上到Production环境上去的。其产品要上Production的基本流程是这样:

产品ER - 指Engineering团队把产品特性完成,通过QA的验证,作为一个可用版本保存。
 ||
 //
服务发布验证 - QA验证完还不够,专门一个小组将发布的可用版本做一次模拟安装,这种模拟安装要求Engineering提高的安装说明必须是傻瓜型的,任何错误都会被打回去。
 ||
 //
Beta - 请少数关系良好的客户,当然包括内部用户试用。
 ||
 //
LA - Limit Available,表示让少数少数关系良好的客户正式使用。
 ||
 //
GA - Global Available,全部使用,这时所有客户才会看到全新产品。

经过的这么都手续,目的就是一个,保证产品升级换代的稳定性。SaaS的软件比传统的软件开发难度大多了,传统卖拷贝的软件,安装新版本,如果出问题,是一个一个个体的问题,而SaaS软件,则所有的客户立刻都遇到问题。只要犯一次错,所有的客户都知道了。

所以SaaS企业往往特别强调他们的服务的稳定性,通常宣称的指标就是5个9,既到达99.999%的高可用性。用一个更直观的说法就是,一年之中,故障时间小于8.76小时。因为全年有365×24=8760个小时,乘以0.001就是8.76小时。

通常这个水平是很难到达的,其影响因素包括网络、硬件、软件、数据库和人员执行等各方面问题。现在最好的SaaS公司大约达到99.990-99.998之间。

建议CSDN迅速采取行动,改善现在糟糕的Hosting能力。
版权声明:本文为博主原创文章,未经博主允许不得转载。 举报

相关文章推荐

《云应用中的服务质量》缩略词

缩略词 含义 AC 交流电 ACID 原子性,一致性,隔离性,持久性 API 应用程序接口 ...

通过CAR与PQ的有机结合为关键业务数据传输提供服务质量保证

一、名词释义 CAR(Committed Access Rate):承诺访问速率。一种流量策略的分类和标记方法,它基于IP 优先级、DSCP值、MAC地址或者访问控制列表来限制IP流量的速率...

我是如何成为一名python大咖的?

人生苦短,都说必须python,那么我分享下我是如何从小白成为Python资深开发者的吧。2014年我大学刚毕业..

检测web服务质量

调用pycurl提供的方法,探测web服务质量,如响应http码,请求延时,http头信息,下载速度等 pycurl安装: easy_install pycurl pip install pyc...

ITU-T E.800 有关服务质量(QoS)的术语定义

摘要 ITU-T E.800建议书为服务质量(QoS)的研究和管理提供了一套通用术语、本建议书列出的与QoS相关的技术和非技术术语旨在代表电信市场所有各方(即用户、服务提供商、制造商和监管机构)的利益...

python探测web服务质量

本文通过pycurl模块提供的方法探测web服务质量的情况, pycurl.Curl()类创建一个Curl句柄对象,关于Curl对象的一下方法使用通过一个例子说明:import os import ...

OpenStack网络指南(23)服务质量(QoS)

QoS被定义为保证某些网络需求(如带宽,延迟,抖动和可靠性)以满足应用提供商与最终用户之间的服务水平协议(SLA)的能力。 网络设备(如交换机和路由器)可以标记流量,以便以更高的优先级处理流量,以满...

网络视频传输的服务质量(QoS)

QoS(Qualityof Service)服务质量,是网络的一种安全机制, 是用来解决网络延迟和阻塞等问题的一种技术。在正常情况下,如果网络只用于特定的无时间限制的应用系统,并不需要QoS,比如We...

TCP/IP 服务质量(QoS)

服务质量(Quality of Service——QoS)是一个正在发展的因特网标准系列,它为优先处理某些类型的 IP 流量提供了方法。通过沿着路由对 QoS 提供适当的支持,就能改善变量延迟和阻塞的...

QoS(服务质量)指标

QoS的关键指标主要包括:可用性、吞吐量、时延、时延变化(包括抖动和漂移)和丢失。下面详细叙述。 可用性   是当用户需要时网络即能工作的时间百分比。可用性主要是设备可靠性和网络存活性相结...

如何制定信息安全管理服务质量指标

如何制定信息安全管理服务质量指标<span style="font-family:宋体;mso-ascii-font-family:Calibri;mso-ascii-theme-font:minor...
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)