提及IBM小型机,我们不得不说到IBM eLiza(蜥蜴)计划以及IBM的小型机的RAS特性。

  eLiza的称呼最早起源于六十年代中期IBM的一个计划,即采用人工智能技术设计一种实现人和计算机之间通讯的程序。在九十年代,IBM设计的深蓝超级计算机战胜了国际象棋大师卡斯帕罗夫,其综合处理能力可比喻于一个蜥蜴(lizard)所具有的功力,即具有预测防范、处理判断以及自我愈合再生能力。

  在当今的IT世界,众多企业都无情地面对一个巨大挑战:为了构成一个强大的灵活自如的电子商务运做环境,需要使用大量的服务器、网络设备、复杂的应用软件等,这些设备所涉及的IT技术在发生着日新月异的变化,企业严重缺乏有经验的工程师来维护和管理整个软硬件系统。

  IBM公司综合自己多年的IT经验,应运而生的提出了eLiza计划,并给它赋予了具有前瞻性的重要内容:即现代企业要想处于不败的竞争地位,其电子商务环境所使用的软硬件系统应具备下列四项原则:

  1、自我配置能力:系统可以动态自我配置有关资源。

  2、自我保护能力:系统有能力保护自己,不受到非法访问和***。

  3、自我愈合能力:系统能够自动预测错误、避免错误、修复错误、取代有关错误部件。

  4、自我优化能力:系统能够自动监视和管理有关资源,将系统性能调整到最佳状态。

  为了达到以上目标,系统还需具备以下七个要素:

  1、负载管理(WorkloadManagement)

  2、安全机制(Security)

  3、群集技术(Clustering)

  4、虚拟主机托管(VirtualServerHosting)

  5、端到端的自动控制(End-to-EndAutomation)

  6、灾难恢复机制(DisasterRecovery)

  7、端到端的系统管理(End-to-EndSystemsManagement)

  下面,编者以IBM p690服务器为例,介绍其RAS特性。

  1、自动首次错误数据捕获和诊断错误隔离能力

  2、自治愈内部POWER4处理器组冗余

  3、业界第一的PCI总线奇偶错误恢复

  4、避免检查中止的不可收集错误处理

  5、动态错误恢复:错误检查和纠正(ECC)或在主存上的等价保护,所有一、二、和三级缓存和内部处理器组

  6、连续和冗余的位操作被使主存具有自治愈功能

  7、在主存上具有的Chipkill纠正功能

  8、N+1的冗余电源,双电源线,和对电源及风扇的在线维护

  9、针对处理器、缓存、内存、I/O和DASD的预计性错误分析

  10、基于运行时错误来决定是否分离处理器运行和启动(动态处理器离线和永久处理器离线)

  11、缓存和主存的离线技术

  12、通过选择高品质的部件最大限度的减少故障

  13、针对电源、风扇和I/O子系统的基于首次故障数据捕获技术的并行、运行间检测技术。