企业计算网格的三大挑战
在分析Oracle应用服务器10g 的具体功能之前,我们有必要先了解一下企业计算在采用网格架构的同时,在多样性、分散性和动态性三方面提出的新的挑战。
- 多样性:网格计算通常包括许多需要管理的资源,其中有服务器、存储器、数据库服务器、应用服务器、企业应用程序以及像目录服务、安全性和身份管理服务这样的系统服务等。管理这些资源及其生命周期是一种艰巨的挑战。
- 分散性:传统的分布式系统一般从集中的管理点进行管理。计算网格进一步加强了这种挑战,因为资源甚至可更加分散,位置上分布在企业内的许多不同数据中心内。
- 动态性:传统的应用程序组件一般在静态的环境中运行,不需要去应对迅速变化的需求。而在计算网格中,系统和应用程序需要能够灵活地适应不断变化的需求。例如,通过Web服务的晚绑定特性和跨平台属性,部署在网格上的应用程序可以包括持续变化的组件集。在某一时间内,这些组件可以在网络中的不同节点上。在如此动态的环境中管理应用程序会是极具挑战性的工作。
Oracle应用服务器10g的五大特性
针对企业计算网格所带来的新挑战,Oracle应用服务器10g提供了丰富的功能以满足其需求,主要可以从"安全性、身份管理和用户供应"、"应用管理与监控"、"可伸缩性"、"高可用性"和"系统管理和监控"五个方面进行介绍。
安全性、身份管理和用户供应
由于计算网格中的资源不再静态地与应用程序绑定,而是按需分配,身份和访问管理过程需要按需应用;此外,在计算网格中,用户的数量、用户访问的资源数量以及这些用户访问资源时使用的不同设备和渠道的数量都在迅速增加。为了简化计算网格中的安全性供应和管理,在Oracle Internet Directory、Oracle应用服务器10g Single Sign-On Server 和Oracle应用服务器Certificate Authority 的基础上,Oracle应用服务器10g提供了一个统一的基于标准的端到端安全性和身份管理基础架构。
- 安全的应用服务器:为了提供安全的环境来运行企业应用程序,Oracle应用服务器10g中增加了许多改善安全性的功能,其中包括综合的Java2安全性支持;SSL 对所有协议(RMI、RMI-over-IIOP、SOAP、JMS、LDAP 等)于PKI安全性基础架构。
- 用户供应与管理:为了提供用户,也就是创建和撤消用户及其身份和访问控制权限,Oracle应用服务器10g提供了:安全性管理控制台以创建用户、角色并定义用户身份和访问控制权限;证书授权以向用户发放证书;委托管理服务,允许管理委托给各种管理员和用户进行自助服务的用户身份、角色和参考;以及创建动态用户群的功能。
- 目录服务--安全性信息中心库:为了存储用户和角色及其相关的身份和访问控制权限的定义内容,Oracle应用服务器10g提供了Oracle Internet Directory。Oracle Internet Directory 将数据库支持的信息中心库用于用户信息,其中有高度优化的算法,以存储大型的用户填写内容并支持各种扇区复制模型,使该信息与其他目录同步。它还支持外部认证模型,允许它与非Oracle认证服务共存。
- 与其他安全性环境集成:为了使Oracle应用服务器能够在多个厂家的计算网格中共存,甲骨文将许多机制与异种安全性环境集成,其中包括 Windows本地认证服务;Active Directory、iPlanet、OpenLDAP和其他目录服务器;以及原有安全性环境。甲骨文的目录集成服务是Oracle Internet Directory 的一种特性,支持使用其他企业用户信息中心库。此外,甲骨文还提供目录设置。
- 网格中的一次性登录 (SSO):为了用户能够鉴别网格中的许多应用程序或服务,甲骨文还提供一种企业一次性登录服务。
Oracle应用服务器10g的安全性与身份管理服务自动处理提供用户的过程、自动创建和删除他们的身份,并自动授予他们访问控制权限。这些实用程序降低了用于安全性管理的人力成本、减少了漏洞,并加速了用户访问他们得到授权的应用程序和网格资源。
应用管理与监控
计算网格拥有一个大型的共享系统基础架构池,支持大量的企业应用程序和用户。该环境中诸如低性能和运行中断等服务质量问题同时影响着大量的用户,因此在计算网格中以集中和前瞻性的方式监控和管理应用程序就成为关键。Oracle应用服务器10g提供了许多功能,用于改善和自动处理计算网格中的应用程序监控和管理。此外,Oracle应用服务器10g还实现了运行在网格上的应用程序的整个生命周期管理自动化。
- 配置与部署:有了Oracle应用服务器10g,J2EE应用程序、Web服务、门户、表单与报表以及商务智能应用程序都可以从Oracle企业管理器(Oracle EntERPrise Manager)在网格内的一个或多个服务器间进行配置和"热部署"。
- 性能调整和调试:Oracle应用服务器10g的动态监控服务 (DMS) 收集 CPU、内存、输入输出等资源使用情况以及响应时间、每秒的请求数以及事务处理吞吐量等性能标准。DMS 允许监控处理请求的关键阶段的持续时间和状态信息,如任何给定的时间内处理的请求数。DMS 灵活地提供该方法,而且不需要对应用程序做任何更改。
- 应用程序性能监控:Oracle应用服务器10g和 Oracle企业管理器的应用程序性能监控 (APM) 使管理员能够监控应用程序对终端用户的实际性能,以及监控不同基础架构中的特定事物处理所花费的时间,组件包括:网络、Web服务器、应用服务器以及数据库服务器。当进入并导航基于网格的应用程序中时,管理员首次能够完全监控他们的电子商务系统,并跟踪他们的实际终端用户的情况。根本原因分析功能支持快速而准确地诊断和解决问题,而深度报表则给管理员提供应用程序性能的完整视图。
- 集成的系统和应用监控:Oracle企业管理器10g网格控制使管理员能够将对其应用程序的监控和管理与运行这些应用程序的系统基础架构联系起来。他们可以为具体的应用程序定义可用性标准,并将这些标准与监控分散的基础架构组件进行绑定,从而获得应用程序的性能和对终端用户的可用性的综合视图。
网格控制允许根据具体情况从 Web应用性能标准深入到底层基础架构,便于对性能瓶颈问题做根本原因分析。因此,通过应用服务器和Oracle网格控制,管理员在一个地方就能获得系统和应用程序的综合集成的视图,极大地改善了管理员迅速准确地诊断应用程序的方式。这减少了人力成本和人为错误,并提高了应用性能和可用性。
可伸缩性
Oracle应用服务器10g提供了许多实用工具来确保系统和应用程序有效地使用现有系统资源,在低成本服务器和存储器上提供最高可伸缩性。这些实用程序包括:
- 应用服务器优化:Oracle应用服务器10g在资源存放池、连接管理、事务管理、网络输入输出以及调度上采取了许多优化措施,以不断在单个的 CPU 或刀片上扩展应用程序。
- 工作负载监控:Oracle应用服务器10g预装了动态监控服务(DMS),这种服务监控多个Oracle应用服务器10g实例、单个Oracle应用服务器10g实例中组件、多个Oracle应用服务器10g应用程序使用资源(CPU 和内存)的情况。所有这些可以绑定到能通过Oracle网格控制(Oracle Grid Control)监控的策略基准中,在性能低于指定的域值时发出警报。
- 基于策略的工作负载管理:Oracle应用服务器10g提供高级的工作负载管理程序,以支持自动的和管理员设定的工作负载管理策略。多种负载均衡算法可用于有效地将工作负载指向具体的服务器、应用服务器实例和应用程序。Oracle应用服务器10g 自动跟踪这些算法,并向管理员推荐哪些是适用于系统工作负载的最佳策略。
- 特定应用策略:Oracle应用服务器10g还能够根据应用程序本身的特征提供相应的工作负载管理策略。例如,最适合Web应用程序的工作负载管理策略对高性能的事务处理应用程序来说可能不是最佳的。于是,Oracle应用服务器10g使管理员能够根据正在运行的工作负载的类别更加灵活地优化工作负载管理策略。
- 服务供应和动态资源分配:Oracle应用服务器10g也提供动态重新配置系统资源和应用程序的能力,可以启用和禁用特定组件,并能在资源需求改变时动态地启动和停止组件。这些资源可以位于一个或多个服务器(多节点)上,而且应用服务器会自动跟踪并维护此环境下的相关性。例如,由于门户用户容量增加而启动企业门户的一个新例程之前,它能确保相关的一次性登录和目录服务已配置并启动。
Oracle应用服务器10g的工作负载管理功能利用尽可能有效的计算容量提供最大限度的可伸缩性,并且它能在特定系统或应用程序的负载增大时快速、有效地增加容量。这些功能可以确保应用程序在有效使用计算资源和容量的同时以优秀的服务质量运行。
高可用性
Oracle应用服务器10g提供许多功能,从而能确保系统和应用程序在低成本服务器和存储器上以最高的可用性运行。这些功能包括:
- 零计划停机时间:这类功能会消除在应用服务器上执行已计划的维护操作时的停机时间。这些功能包括:滚动升级,在没有停机时间的情况下将Oracle9i应用服务器升级到 Oracle应用服务器10g ;配置存档和闪回,及时将配置退回到一个特定的点,从而解决人为的配置错误。
- 零意外停机时间:这类功能能消除系统故障、人为错误或灾难时发生的停机时间。这些功能包括:集成处理和故障监控,包括相关性分析,无论在单服务器或多服务器环境下都能提供自动故障检测与恢复;冷故障切换和活动的故障切换集群,这些解决方案可以在硬件或软件发生故障时提供自动故障切换;自动备份和恢复,提供自动、增量的备份和应用服务器的某时段的恢复,包括对软件、配置和应用程序的恢复;灾难恢复,自动创建备用的应用服务器和备用数据库,从而保护系统免受灾难性损失。
- 故障切换通知(FaN):为了提高端对端的高可用性,甲骨文将故障监控和应用服务器的通知服务与实际的应用集群 (RAC) 集成在一起。当一个RAC节点发生故障时,Oracle应用服务器会收到来自RAC的故障通知(FaN)事件,然后自动地将应用服务器的连接和工作负载切换到另一个活动的集群节点。这将总的应用程序故障切换时间从 15 分钟减少到几秒钟。
在计算网格中,Oracle应用服务器10g的工作负载管理特性能提供最大程度的可伸缩性和高可用性。这些功能可以确保应用程序在尽可能有效地使用计算资源和容量的同时以优秀的服务质量运行。
系统管理和监控
最后,为了降低系统管理成本并有效使用系统容量,系统软件有必要解决由计算网格引入的两个最重要的系统监控和管理挑战:首先,资源监控和再分配,即计算资源(例如内存和 CPU)需要有效而且精确地监控,以便减少空闲容量并优化使用现有资源的可用性;此外,计算资源需要有效的管理和自动控制功能,从而减少逐步增加的人力成本和有错误倾向的人为干涉。
由于网格计算的规模、多样性、分散性和需要管理的资源的不断变化,它使系统管理更有挑战性。然而,为了在计算网格中大幅度降低系统管理成本,甲骨文已经使Oracle应用服务器10g的自动管理特性可以自动处理许多低级系统管理任务。另外,甲骨文已经将Oracle应用服务器10g和Oracle 企业管理器10g的网格控制集成在一起,从而能对许多服务器提供统一的监控与管理。
- 状态监控:Oracle应用服务器10g中的所有服务都通过Oracle进程管理和通知服务 (OPMN) 进行启动、停止和管理。OPMN通过网格对这些服务提供自动死机检测和快速重新启动。然后,OPMN 就将这些统计值提供给网格控制,这样网格控制就能提供实时的汇总,并对整个网格提供系统可用性和损耗的历史报表。
- 性能和资源监控:Oracle应用服务器10g中的所有服务都经过改进,以便能通过动态监控服务 (DMS) 随时提供性能和资源的消耗信息。DMS 生成的统计值和来自主机操作系统的资源使用统计值一起由网格控制收集并解译。网格控制提供Oracle应用服务器10g历程的实时和历史性能的总体视图,包括对历程中每个组件性能的汇总。
- 基准和基于策略的管理:为了减少对劳动密集型管理的需要并允许管理员在问题发生之前对固定系统进行干预,Oracle应用服务器10g和网格控制一起为用户提供了定义管理策略以及为策略建立基准的能力。例如,管理员可以建立一个性能基准并设定阈值,当性能低于阈值时就收到警报。另外,为了达到这些阈值,管理员也可以建立并使用一个优化的系统配置。然后,这些基准设置可以作为创建新系统的标准使用。网格控制允许用户轻松地定义策略、为策略建立基准并监控系统是否违反策略。另外,Oracle应用服务器提供许多灵活的策略,包括为这些策略推荐的基准。这大量减少了管理员用在诊断系统问题上的时间。
- 系统通知:当某个目标变得不可用或者某个策略基准被破环(例如,性能阈值被破坏)时,Oracle应用服务器10g会自动向网格控制提出警报。然后网格控制就会通过电子邮件(包括 Email-to-Page 系统)、SNMP捕捉器或通过运行自定义脚本向正确的管理员发送通知。网格控制通过不同通知方法支持不同的通知机制。一个通知方法用来指定与特殊通知机制相关的详细资料。
- 更改跟踪和管理:有时,管理员发现他们有责任弄清为什么曾经运转良好的系统会突然以一种不能接受的水平执行任务。有人更改了配置参数吗?应用了操作系统补丁程序?还是删除了内存?如果管理员必须手动检查每种可能的情况,那么试图确定引起系统性能下降的确切原因可能需要几个小时。由于网格内有众多节点,想确定变更原因就变得更加复杂。通过跟踪所有硬件和软件的安装和配置的变化,网格控制简化了确定过程。这使管理员能快速、轻松地查看到机器自从上次正常运行后所作的更改。另外,应用服务器的闪回性能允许管理员将系统自动还原到一个原来的配置或适当的基准,从而解决系统性能问题。
- 作业调度程序:最后,在计算网格中,管理员需要执行几项每日必做的管理任务。这些任务包括:回收Java虚拟机,解决垃圾收集问题;重新启动Web 服务器或Web高速缓存以及磁盘碎片整理。为了自动操作这些任务,Oracle 网格控制提供一个集成的作业调度程序,该程序能在特定的一段时间内自动取消多个系统中特定的作业。
Oracle应用服务器10g和Oracle网格控制的系统管理特性能在计算网格中以最低的管理成本提供最佳的服务质量。
作为Oracle应用基础架构软件集成套件的下一代产品,Oracle应用服务器10g为用户提供了三种重要的优点:
- 消除过剩的计算容量:通过自动工作负载管理分配工作负载,从而有效地使用空闲计算容量。
- 启用标准、便宜的容量扩展方案:能够通过快速有效的软件供应随时使用低成本标准单元增加计算容量。
- 大幅度降低管理成本:通过自动管理系统,可以减少高成本、有错误倾向的人为干涉;并且通过跨越多个系统的自动软件供应和管理大幅度降低管理成本。
通过这些特点,Oracle应用服务器10g成功地实现了在大幅度降低系统和应用程序监控和管理成本的同时,以非常高的性能、可伸缩性和可用性在低成本服务器和存储器集合上运行企业应用程序。(完)