导入源数据
导入源数据
目的
在本课程中,您将定义源对象的结构,这是仓库设计的第一步。通过使用 OWB 导入向导,您将了解到 Warehouse Builder 是如何使用不同的方法从关系表和平面文件中获取元数据的。
Warehouse Builder 10g 第 1 版 (10.1) 支持 Oracle 数据库 10g 源和目标。
主题
本课程将讨论以下主题:
所需时间
完成本课程大约需要 60 分钟的时间。
查看屏幕截图
将鼠标移到该图标上可以显示所有屏幕截图。还可以将鼠标移到特定的图标上来查看相关的屏幕截图。
概述
本课程主要介绍如何使用 Oracle Warehouse Builder 创建源模块。您将创建一个平面文件源模块和一个关系数据库源模块。创建源对象后,您将指定源模块的源数据。最后,您将学习如何将源对象元数据导入到源模块中。
前提条件
为顺利完成本课程,您需要:
1.
完成了概述课程。
2.
创建平面文件源模块
有时,您的数据可能存储在平面文件中。在本主题中,您将使用 New Module Wizard 创建一个平面文件源模块。
1.
展开 OWB10g_DEMO 项目。展开 Files 节点。
2.
右键单击 Files 节点并选择 Create Flat File Module。
3.
单击 New Module Wizard:Welcome 页中的 Next。将该模块命名为 DQ_SOURCE。接受 Development 作为模块状态,然后单击 Next。
模块状态的下拉列表中包含三个选项:Development、Quality Assurance 和 Production。这三个选项仅用于说明用途。
4.
在 Connection Information 窗口中,指定要导入 Warehouse Builder 中的文件所在目录。单击 Browse...。
5.
如果按照第 1 课中的说明将设置文件保存在驱动器 C 下,则在 Flat File Directory Chooser 窗口的 Drives 下拉列表中,选择 (C:\),导航到文件夹 OWB-OBE 并选择文件夹 DQ。如果将设置文件保存到了其他位置,则找到并选择文件夹 DQ。该文件夹包含您将导入的源定义。在 Flat file Directory Chooser 窗口中单击 OK。
此时再次出现 Connection Information 窗口,其中显示了选定路径。单击 Next。
6.
位置定义的是您要在其中部署对象的数据库模式或目标工具的相关信息。
要创建一个新位置,请执行下列操作:单击 New。
此时出现New Location Dialog 窗口。在 Name 域中键入 DQ_SOURCE_LOC。根据为其创建位置的模块类型,选定 File System 类型。单击 Ok 关闭 New Location Dialog 窗口。
7.
在Finish 窗口中,检查您已经指定的定义。选中 Proceed to the Import Metadata Wizard框并单击 Finish。
在下个主题中,您将学习如何使用 Import Metadata Wizard。
导入平面文件元数据
在本主题中,您将学习如何使用 Import Metadata Wizard 将元数据导入到平面文件源模块中。
1.
在 Import Metadata Wizard:Welcome 页上单击 Next。在 Filter Information 窗口中,接受默认选项 All Data Files,然后单击 Next。
2.
在 Object Selection 窗口中,展开 C:\OWB-OBE\\DQ 节点或将显示解压缩设置文件的位置。使用 >> 将所有文件定义移动到右侧。
您选择并移动到右侧的所有文件将导入到 Warehouse Builder 中。单击 Next。
3.
此时出现 Summary and Import页。如果尚未选择第一个记录 (customers_system3_txt),请将其选定。
在该页上,您看到了两个以红灯指示器为前缀的文件定义(customers_system3_txt 和 customers_system4_txt)。红灯指示器指示没有可用于这些文件的元数据。导入之前,Warehouse Builder 需要了解这些文件的结构。通过该抽样过程,系统收集到了有关结构的信息。
您将学习如何先对 customers_system3.txt 文件进行抽样,然后对 customers_system4.txt 进行抽样。
单击 Sample。
4.
单击 Flat File Sample Wizard:Welcome 页上的 Next。此时出现Flat File Sample Wizard:Name 页。请在该页上指定文件名以及要抽样的行数。Warehouse Builder 提供了大量可用于读取数据的字符集。
接受默认抽样文件的名称。这是 Warehouse Builder 在导入后将引用的文件名称。接受默认的抽样行数 200。单击 Next。
5.
此时出现 Flat File Sample Wizard:Record Organization 页。使用 Record Organization 页可指定记录在抽样文件中的组织方式。
接受默认选项 Records delimited by carriage return (),然后单击 Next。
6.
在 Flat File Sample Wizard:File Layout 页中,接受 Skip Rows 的默认值 0。该文件是单个记录类型文件的示例,对 Record Type 选择 Single,然后单击 Next。
您可以在此页中指定跳过的行数。Warehouse Builder 还支持多个文件记录类型。
7.
此时出现 Flat File Sample Wizard:File Format页。请在此页上指定文件结构的格式。系统支持固定长度的文件和字符分隔文件。
选择 Delimited 并单击 Next。
8.
此时出现 Flat File Sample Wizard:Field Properties 页。选择 Use the first record as the field names。如果平面文件的第一个记录是标题,则可以使用第一个记录中的值作为字段名称。
注意,某些数据类型现在已经更改。某些没有列名的值实际上是数字。单击 Next。
9.
在对文件 customer_system_3.txt 进行抽样后,检查汇总规范。单击 Flat File Sample Wizard:Summary 页上的 Finish。
10.
此时再次出现 Import Metadata Wizard:Summary and Import 页。该向导现在已经完成了 customers_system3_txt 文件(由绿灯指示器指示)的抽样过程(标识该结构)
选定记录 (customers_system4_txt) 的旁边有一个红灯,指示需要对其进行抽样。
11.
完成前,确保每个文件的旁边均有一个绿灯指示器,以表示 Warehouse Builder 知道每个文件的结构。
customers_system4_txt 文件已被选中。要对 customers_system4_txt 文件进行抽样,可以执行上面的第 3 步到第 10 步,而要节省时间,可以从 Same As 下拉框中选择 Same As customers_system3_txt。(当要抽样的文件的结构与前面抽样过的任何一个文件相似时,则必须使用 Same As 选项)。单击 Import Metadata Wizard:Summary and Import页中的 Finish 以完成导入。
12.
对这两个文件进行抽样后,展开 Files 节点下的 DQ_SOURCE模块。您将看到已经导入了平面文件中的元数据。
创建 Oracle 源模块
您已经学习了如何创建源模块来定义平面文件源。在本主题中,您将学习如何创建一个源模块来定义关系表源。
1.
在 OWB10g_DEMO 项目中,展开 Databases 并选择 Oracle 节点。
右键单击 Oracle 节点。选择 Create Oracle Module,然后单击 New Module Wizard:Welcome 页(如果出现该页)上的 Next。
2.
此时出现 New Module Wizard:Name 页。将该模块命名为 NA_SOURCE。接受模块状态的默认选项 Development。选择 Data Source 作为模块类型。单击 Next
3.
此时出现 New Module Wizard:Data Source Information 页。接受默认选择 Generic Oracle Database Application 和 Oracle Database 8i/9i/10g。单击 Next。
4.
此时出现 New Module Wizard:Connection Information 页。请在该页上指定要设置的元数据源。选择 Oracle Data Dictionary 导入 Oracle 数据库中的元数据。
可以从现有数据库链接中进行选择,也可以创建一个新链接。您现在将学习如何创建一个新链接。选择 New DB Link...。
创建数据库源的源模块时,请在 Warehouse Builder 信息库中创建或选择一个指向源系统的数据库链接。Warehouse Builder 使用此链接访问源模块的数据字典。
5 .
此时出现 New Database Link 对话框。您将指定链接的详细信息。在 DB Link Name 域中键入 NA_SOURCE。选择Host Name单选按钮并提供以下信息。在 hostname 域中键入 localhost 或 ,在 Port number 域中键入1521,在 Oracle Service Name 域中使用 obeowb或 。在 username 和 password 域中键入NA_SOURCE。
单击 Create and Test。这将对您提供的连接信息进行测试,并将显示消息 Testing Successful...。单击 OK 返回到 New Module Wizard:Connection Information 页。
您将注意到所创建的链接已被选中,并显式了其他详细信息。单击 Next。
6 .
此时出现 New Module Wizard:Location 页。请在该页上创建一个新位置,或从先前指定的位置的下拉列表中进行选择。要定义一个新位置,请单击 New...。
在 Name 域中键入 NA_SOURCE_LOC,在 Type 域中选择 Oracle Database,并在 Version 域中选择 10.1。单击 OK。
此时出现 New Module Wizard:Location 页,其中显示了新位置。单击 Next。
7 .
在New Module Wizard:Finish 页中检查已经指定的定义。选中 Proceed to the Import Metadata Wizard框并单击 Finish。
在下一个主题中,您将继续学习如何使用 Import Metadata Wizard。
导入表元数据
在本主题中,您将学习如何使用 OWB Import Metadata Wizard 导入 Oracle 关系数据库模式中的源元数据。
1.
单击 Import Metadata Wizard:Welcome 页中的 Next。
此时出现 Import Metadata Wizard:Filter Information 页。请在该页上选择要导入到 Warehouse Builder 源设计的对象类型。对于本示例,请取消选择所有其他选项,确保只选择 Table 作为对象类型。单击 Next。
2.
此时出现 Import Metadata Wizard:Object Selection 页。展开 TABLE 并使用 ( >) 或 (>>) 箭头按钮将 Available Objects 列表中的选定对象或所有对象移动到 Selected Objects 列表。
使用 >> 将两个表移动到右侧。
单击 Next。
3.
此时出现 Import Metadata Wizard:Summary and Import 页。验证是否选择了要导入到 Warehouse Builder 中的所有对象。单击 Finish。Warehouse Builder 将导入包括约束(如果存在的话)在内的所有定义。检查 Warehouse Builder 创建的定义。
单击 Finish 将启动元数据导入过程,此时出现 Importing Progress 对话框。
单击 Import Results 窗口中的 OK 以导入表定义。您现在已经完成了 Oracle 数据库定义的导入。
4.
在 Oracle Warehouse Builder 客户端中,检查导入的元数据。展开 NA_SOURCE 模块并检查为表导入的元数据。
总结
在本单元中,您应该已经学会如何:
创建源模块
创建平面文件源模块
创建数据库源模块
通过创建数据库链接为数据库源配置连接信息
创建平面文件源定义
导入数据库中的定义
将鼠标移到该图标上可以隐藏所有屏幕截图。