远程部署是在远程服务器上安装和配置软件的过程。
1、我们首先了解下什么是远程服务器:
远程服务器是与客户端不在同一物理机器上的服务器。
图1 远程服务器
远程服务器用于存储数据或运行程序:
1)存储数据:存储各种目的的数据和文件:存储应用程序的数据、存储数据库的数据;
2)运行应用程序:包括web应用程序、监控程序等。
2、什么是远程部署:
远程部署是在远程服务器上安装和配置软件的过程。这通常通过在自动安装和配置过程的服务器上运行一个或一系列脚本来完成。
使用远程部署有很多好处,包括一次将软件部署到多个服务器的能力,自动化流程的能力,以及在出现错误时回滚更改的能力。
常见的应用场景有:
1)远程部署最常见的应用之一是部署web应用程序。这可以通过将应用程序代码复制到服务器、安装依赖项和配置web服务器来完成。
2)另一个常见的应用是部署数据库或更改。这可以通过在服务器上运行更新数据库模式和数据的SQL脚本来实现。
3)远程部署还可以用于部署服务器配置更改。这可以通过更新服务器上的配置文件或使用像Puppet或Chef这样的配置管理工具来完成。
总的来说,远程部署是一个强大的工具,可以用于自动化服务器上的软件安装和配置。这可以节省大量的时间和精力,并且可以更容易地管理多个服务器。
远程部署并行作业时,可以在与引擎层主机不同的计算机上存储和运行这些作业的脚本。
例如,远程部署选项可以用于在网格计算环境中运行作业。
具有已部署作业的任何远程计算机必须有权访问并行引擎以运行该作业。此类计算机还必须具有该平台类型的正确运行时库。
由于这些作业不在 InfoSphere® DataStage® 引擎层上运行,因此无法使用任何引擎层组件(如,BASIC Transformer 阶段、服务器共享容器、之前和之后子例程以及作业控制例程)。此外,提供了一组有限的插件阶段以在这些作业中使用。
运行这些作业时,InfoSphere DataStage 所提供的日志记录、监视和操作元数据收集设施不可用。已部署作业的输出包括内部并行引擎格式的日志记录信息,但您必须收集这些日志记录信息。
要准备并行作业以进行部署,请使用 InfoSphere DataStage Designer 客户机开发作业,然后编译该作业。 此类作业还可以在 InfoSphere Information Server 引擎的控制下运行(通过使用 Designer 或 Director 客户机,或者通过使用 dsjob 命令)。 在使用其中任何方法运行作业时,将使用项目目录中的可执行文件,而非部署脚本。
要在远程计算机上运行已部署作业,首先必须在远程计算机上定义配置文件,将部署包传输到远程计算机,并在远程计算机上完成其他配置步骤。
下图显示了示例部署系统的概念视图。在该示例中,可部署作业将传输到三台主导节点计算机。引擎层主机和主导节点计算机运行相同的操作系统。 每个主导节点都有一个配置文件,用于描述可用于运行作业的资源。然后,这些作业会在该主导节点计算机的控制下运行。
启用项目进行作业部署
在 InfoSphere DataStage Administrator 客户机中,您可以设置项目以使该项目中的作业可部署。
准备主机和远程计算机以进行远程部署
要能够在远程计算机上部署和运行作业,首先必须确保主机和远程计算机按相同方式进行设置。还必须完成一些系统配置步骤,这因操作系统而异。
部署作业
针对远程部署启用某个项目后,您可以部署该项目中设计的并行作业。设计作业后,封装该作业并将其传输到远程计算机。
准备运行已部署作业
在运行已远程部署的作业之前,必须更新远程计算机上的一些作业文件和配置文件。要完成的步骤取决于您的操作系统。
部署软件包
启用了远程部署的情况下在 InfoSphere DataStage Designer 客户机中编译作业时,缺省情况下会产生一组文件。
服务器端插件
InfoSphere DataStage XML 和 Java™ 插件都在远程节点上运行。要运行插件,您可以将 InfoSphere DataStage 安装中的目录复制到节点。