转:DataStage 学习版文档V0.65

1、简介
数据中心(数据仓库)中的数据来自于多种业务数据源,这些数据源可
能是不同硬件平台上,使用不同的操作系统,数据模型也相差很远,因而数
据以不同的方式存在不同的数据库中。如何获取并向数据中心(数据仓库)
加载这些数据量大、种类多的数据,已成为建立数据中心(数据仓库)所面
临的一个关键问题。针对目前系统的数据来源复杂,而且分析应用尚未成型
的现状,专业的数据抽取、转换和装载工具DataStage 是最好的选择。
Websphere DataStage 是一套专门对多种操作数据源的数据抽取、转换
和维护过程进行简化和自动化,并将其输入数据集市或数据中心(数据仓库)
目标数据库的集成工具。
DataStage 能够处理多种数据源的数据,包括主机系统的大型数据库、
开放系统上的关系数据库和普通的文件系统等,以下列出它所能处理的主要
数据源:
大型主机系统数据库:IMS,DB2,ADABAS,VSAM 等
开放系统的关系数据库:
Informix,Oracle,Sybase,DB2,Microsoft SQL Server 等
ERP 系统:SAP/R3,PeopleSoft 系统等
普通文件和复杂文件系统,FTP 文件系统,XML 等
IIS,Netscape,Apache 等Web 服务器系统
Outlook 等Email 系统

DataStage 可以从多个不同的业务系统中,从多个平台的数据源中抽取数
据,完成转换和清洗,装载到各种系统里面。其中每步都可以在图形化工具
里完成,同样可以灵活的被外部系统调度,提供专门的设计工具来设计转换
规则和清洗规则等,实现了增量抽取、任务调度等多种复杂而实用的功能。
其中简单的数据转换可以通过在界面上拖拉操作和调用一些DataStage 预定
义转换函数来实现,复杂转换可以通过编写脚本或结合其他语言的扩展来实
现,并且DataStage 提供调试环境,可以极大提高开发和调试抽取、转换程
序的效率。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值