目的
平面文件是数据仓库项目的一种典型数据源。在本教程中,您将学习如何创建平面文件源模块。模块是项目中的存储对象,它们可帮助您以逻辑方式对源和目标对象定义进行分组。源模块保存的元数据用于描述源系统,您将从这些源系统中提取数据。目标模块保存的元数据则用于描述目标数据仓库或数据集市。
平面文件源模块定义了与包含一些平面文件示例的文件夹的连接。您将学习如何使用向导将平面文件元数据导入到平面文件源模块中。除了上机操作平面文件源之外,您还将看到一个有关 OWB 如何处理关系表数据库源的演示。
注: 本教程及其设置脚本仅支持 OWB 11g 第 1 版。该 Oracle 示例教程的早期版本可用于 OWB 10g 第 1 版和第 2 版。
主题
本教程包括下列主题:
概述
前提条件
创建平面文件源模块
导入平面文件元数据
检查 Oracle 数据库模块
总结
Warehouse Builder 需要元数据来描述产品中使用的源对象。为此,您要将源组织到一些称为模块的特定的元数据组中。模块引用 OS 目录或数据库模式。因此必须首先创建平面文件模块,然后再导入源中的元数据。无论对于文件还是模式中的表,要完成上述目的的过程都是相似的。
本教程主要讲述了如何定义一个存储平面文件元数据的源模块。 您将学习如何使用 Import Metadata Wizard 来选择希望导入的平面文件,以及如何使用 Flat File Sample Wizard 来检查和记录平面文件的元数据。Flat File Sample Wizard 用于存储在 Warehouse Builder 库中定义的元数据。另外,在屏幕截图和说明的帮助下,您将了解如何检查 Oracle 数据库源模块。
开始学习本教程之前,您应已经:
1. | 下载了 owbdemo_files.zip 文件,并将该文件解压缩到一个驱动器上,如您计算机硬盘的 D 盘 |
2. | 完成了教程 1,继续以 rep_owner/rep_owner 用户身份登录 |
在本主题中,您将学习如何创建平面文件模块,之后您会向其中添加描述平面文件源的元数据。您现在创建的源模块最终将保存特定于平面文件的元数据;因此,此模块位于 Warehouse Builder Project Explorer 的 Files 节点中。
1. | 您已经以 rep_owner/rep_owner 用户身份登录到 Design Center 中。展开 Project Explorer 面板中的 OWB_DEMO 项目。右键单击 Files 节点,然后选择 New。 出现 Create Module Wizard:Welcome 页。单击 Next。 出现 Create Module Wizard:Name and Description 页。 |
2. | 在 Create Module Wizard:Name and Description 页中,输入 SOURCE 作为该模块的名称。单击 Next。
出现 Create Module Wizard:Connection Information 页。在平面文件源模块中,位置是指平面文件所在的文件系统中的路径或目录。 |
3. | 在 Create Module Wizard:Connection Information 页中,OWB 创建一个默认的位置,即 SOURCE_LOCATION1。单击 Edit。 出现 Edit File System Location:SOURCE_LOCATION1 窗口。 |
4. | 在 Edit File System Location:SOURCE_LOCATION1 窗口中,将默认名称 SOURCE_LOCATION1 重命名为 SOURCE_LOCATION。单击 Browse。 在 Browse Directory 窗口中,选择 D:\newowbdemo\sourcefiles 或者您在其中保存安装脚本的驱动器和目录(包含有源文件夹)。单击 Select。 |
5. | 在 Edit File System Location:SOURCE_LOCATION1 窗口中检查路径,然后单击 OK。 |
6. | 在 Connection Information 窗口中,请确保选择了 Import after finish。选择此选项将启动 Import Metadata Wizard。单击 Next。 提示:如果未选择该复选框,则 Import Metadata Wizard 不会自动启动。要手动启动 Import Metadata Wizard,在 Project Explorer 中展开 Files,右键单击 SOURCE 模块,然后选择 Import。 出现 Create Module:Summary 页。 |
7. | 在 Summary 页中检查模块设置。单击 Finish。 此时,平面文件模块的定义已完成。Import Metadata Wizard 向导自动启动。如果您暂时将该向导移至一侧,您可以在 Design Center 中看到,在 Project Explorer 的 Files 节点中已经创建了该源模块。 |
创建了平面文件模块之后,您就可以将平面文件定义导入到 Warehouse Builder 中了。Import Metadata Wizard 将指导您完成导入元数据对象的全部过程。每次使用 Import Metadata Wizard 从现有平面文件导入元数据时,Import Metadata Wizard 都会启动 Flat File Sample Wizard。使用 Flat File Sample Wizard 可检查并记录平面文件的元数据。
使用 Import Metadata Wizard | ||
使用 Import Metadata Wizard
1. | 在 Import Metadata Wizard:Welcome 页中,单击 Next。 出现 Import Metadata Wizard:Filter Information 页。 |
2. | 在 Import Metadata Wizard:Filter Information 页中,接受默认选择 All Data Files,单击 Next。 此时出现 Import Metadata Wizard:Object Selection 页。 |
3. | 在 Import Metadata Wizard:Object Selection 页中,展开 D:\newowbdemo\sourcefiles 节点(或您在教程 1 中将安装文件解压缩到的其他任何位置)。显示文件列表。使用 >> (Add All) 将 Available 列表中的所有文件定义移至 Selected 列表。单击 Next。 出现 Import Metadata Wizard:Summary and Import 页。 |
4. | 注: 在此页中,您会看到两个前面带有红色叉号的文件定义(expense_categories_csv 和 export_csv)。红色叉号表示在 Warehouse Builder 库中没有此文件可用的元数据信息。导入之前,Warehouse Builder 需要了解这些文件的结构。通过该抽样过程,系统收集到了有关结构的信息。 在 Import Metadata Wizard:Summary and Import 页中,选择 expense_categories_csv 文件(如果尚未选择)。单击 Sample。 出现 Flat File Sample Wizard。 |
使用 Flat File Sample Wizard
1. | Flat File Sample Wizard 将引导您完成平面文件结构的定义。在 Flat File Sample Wizard:Welcome 页中,单击 Next。 出现 Flat File Sample Wizard:Name 页。 |
2. | 在 Flat File Sample Wizard:Name 页中,接受 EXPENSE_CATEGORIES_CSV 作为默认文件名。这是 Warehouse Builder 在该文件导入之后引用该文件时使用的名称。Warehouse Builder 提供了大量可用于读取数据的字符集。 接受此页上的默认值。此文件有 2 列:Expense Type 和 Expense Categories。此向导对该平面文件的结构作出假设。该对话框的下半部分显示了 OWB 如何将几行平面文件数据导入表列的示例。单击 Next。 出现 Flat File Sample Wizard:Record Organization 页。 |
3. | 注:使用 Record Organization 页可指定记录在抽样文件中的组织方式。 在 Flat File Sample Wizard:Record Organization 中,接受以回车 () 分隔记录的默认选项。单击 Next。 出现 Flat File Sample Wizard:File Format 页。 |
4. | 注: 您需要在此页上指定文件结构的格式。系统支持固定长度的文件和字符分隔文件。 提示: 如果您的文件具有不同的分隔符,您可以在 Field Delimiter 下拉列表中输入它。Warehouse Builder 使用您输入的分隔符。 在 Flat File Sample Wizard:File Format 页中,接受文件格式的 Delimited 默认选项。单击 Next。 出现 Flat File Sample Wizard:File Layout 页。 |
5. | 注: 您可以在此页中指定跳过的行数。对于记录类型,您可以选择单个记录或多个记录。 在 Flat File Sample Wizard:File Layout 页中,接受 Skip Rows 的默认值 0。Expense_categories.csv 文件是单个记录类型文件的示例。为记录类型选择 Single Record,然后单击 Next。 出现 Flat File Sample Wizard:Field Properties 页。 |
6. | 如果平面文件的第一个记录是标题,则可以使用第一个记录中的值作为字段名称。在 Flat File Sample Wizard:Field Properties 页中,选择 Use the first record as the field names。 注意下面屏幕截图中的字段名称已经更改。 提示:注意右侧的 SQL 数据类型,通过这些数据类型,您可以根据此文件控制外部表数据类型等内容。 单击 Next。 出现 Flat File Sample Wizard:Summary 页。 |
7. | 检查为文件 expense_categories_csv 定义的规格汇总。在 Flat File Sample Wizard:Summary 页中,单击 Finish。 向导创建平面文件。Flat File Sample Wizard 会带您返回 Import Metadata Wizard。 |
8. | 在 Import Metadata Wizard:Summary and Import 页中,expense_categories_csv 的 Status 字段中的绿色对号表示 expense_categories_csv 已经过抽样。 现在,您将继续抽样第二个平面文件。 |
9. | 选择 export_csv 文件(如果尚未选择)。单击 Sample。 提示:为了节省时间,您可以在 Same As 下拉列表中选择 Same As 。(当要抽样的文件的结构与前面抽样过的任何一个文件相似时,必须使用 Same As 选项)。在此示例中,要抽样的两个文件的结构不相似。 出现 Flat File Wizard:Welcome 页。单击 Next。 |
10. | 在 Flat File Sample Wizard:Name 页中,接受 EXPORT_CSV 作为默认文件名。这是 Warehouse Builder 在该文件导入之后引用该文件时使用的名称。 接受此页上的默认值。此文件有 14 列。单击 Next。 出现 Flat File Sample Wizard:Record Organization 页。 |
11. | 注: 使用 Record Organization 页可指定记录在抽样文件中的组织方式。 在 Flat File Sample Wizard:Record Organization 中,接受以回车 () 分隔记录的默认选项。单击 Next。 出现 Flat File Sample Wizard:File Format 页。 |
12. | 注: 您需要在此页上指定文件结构的格式。系统支持固定长度的文件和字符分隔文件。 在 Flat File Sample Wizard:File Format 页中,接受文件格式的 Delimited 默认选项。单击 Next。 出现 Flat File Sample Wizard:File Layout 页。 |
13. | 注: 您可以在此页中指定跳过的行数。对于记录类型,您可以选择单个记录或多个记录。 在 Flat File Sample Wizard:File Layout 页中,接受 Skip Rows 的默认值 0。export.csv 文件是单个记录类型文件的示例。为记录类型选择 Single Record,然后单击 Next。 出现 Flat File Sample Wizard:Field Properties 页。 |
14. | 在 Flat File Sample Wizard:Field Properties 页中,选择 Use the first record as the field names。如果平面文件的第一个记录是标题,则可以使用第一个记录中的值作为字段名称。 请注意,此时字段名称已经更改。 |
15. | 注: 除非您已完成了步骤 15,否则不要单击向导页上的 Back 按钮。这可能会导致错误,原因在于日期是一个保留字,而您还没有重命名日期字段。 在 Flat File Sample Wizard:Field Properties 页中,选择 Date。 因为 Date 是保留字,所以需要将 Date 重命名为 Expense_Date。 在 Type 下拉列表中选择 Date。在 Mask 列中,键入 dd-mon-yy(不带单引号)。 |
16. | 在 Flat File Sample Wizard:Field Properties 页中,选择 Reimbursable_Amount_(USD)。 因为“(”和“)”都是保留字符,所以将 Reimbursable_Amount_(USD) 重命名为 Reimbursable_Amount。 在 Type 下拉列表中选择 Decimal External。 注: 滚动到该对话框的右侧,查看 SQL Properties。向导根据您在 Tpe 列中的选择创建默认的 SQL Properties。 单击 Next。出现 Flat File Sample Wizard:Summary 页。 |
17. | 检查为文件 EXPORT_CSV 定义的规格汇总。在 Flat File Sample Wizard:Summary 页中,单击 Finish。 向导创建平面文件。Flat File Sample Wizard 会带您返回 Import Metadata Wizard。 |
18. | 在 Import Metadata Wizard Summary and Import 页中,EXPENSE_CATEGORIES_CSV 和 EXPORT_CSV 的 Status 字段中的绿色对号表示两个文件均已经过抽样。在 Import Metadata Wizard:Summary and Import 页中,单击 Finish。 此时导入过程开始。Importing Progress 对话框显示了导入进度。 在 Project Explorer 中展开 Files > SOURCE。您将看到刚刚抽样并导入的两个表(EXPENSE_CATEGORIES_CSV 和 EXPORT_CSV)。 在 Design Center 中,单击工具栏上的 Save All 。在 Warehouse Builder Warning 窗口中,单击 Yes 提交您的工作。 |
除平面文件元数据源之外,您将创建一个用于各种其他源的模块,如用于基于 Oracle 的关系表源元数据的模块。涵盖的主题假定您的源数据已经以平面文件的形式存在。
在该子主题中,您将阅读一个有关如何从 Oracle 源中导出数据的演示。在本示例中,您将从一个 Oracle 数据库的模式中导出数据,该模式中存储有 HR 数据。下面的步骤仅供了解,无需执行。在说明和屏幕截图的帮助下,您能够理解这些概念。
1. | 请再次注意: 在这一步,您将了解如何创建 Oracle 模块。在 Project Explorer 中,展开项目 OWB_DEMO > Databases。右键单击 Oracle,选择 New。在 Create Module -Welcome 页中,单击 Next。 在 Create Module Wizard:Name and Description 页中,输入 HR 作为 Oracle 数据源模块的名称。模块类型是 Data Source。单击 Next。 | ||||||
2. | 向导的下一页是 Connection Information 页。OWB 为每一个已创建的模块创建一个位置名。正如您在屏幕截图中所看到的,位置名是 HR_LOCATION1。位置特定于 Oracle 数据库或平面文件等模块类型。 | ||||||
3. | 单击 Edit 启动 Edit Oracle Database Location 页。在 Edit Oracle Database Location 页中,将默认的位置 HR_LOCATION1 重命名为 HR_LOCATION。您还要提供连接信息(用户名、口令、主机、端口和服务名),它们用于指定元数据的源。在本示例中,提供的连接详细信息用于连接到 HR 模式。 提示: 您可以使用各种连接类型:
单击 Test Connection。您提供的连接信息已经过测试,连接成功后将显示“Successful”消息。单击 OK。 | ||||||
4. | 在 Connection Information 页中,确保已选择 Import after finish 选项,进入 Import Metadata Wizard。 单击 Next。在 Summary 页中,单击 Finish。 出现 Import Metadata Wizard Welcome 页。单击 Next。 |
5. | 利用 Import Metadata Wizard,您可以将元数据从数据库导入到模块中。选择您想导入到 HR Oracle 源模块中的对象。 在 Filter Information 页中,选择您想要导入的对象类型。 单击 Next。在 Object Selection 页中,选择您想要导入的具体对象。 Warehouse Builder 将导入包括约束(如果存在的话)在内的所有定义。在本示例中,您选择了 COUNTRIES 表,Warehouse Builder 识别了通过一个外键关联的 REGIONS 表。在 Confirm Import Selection 对话框中,单击 OK 导入相关的 REGIONS 表。单击 Next。 |
6. | 在 Summary and Import 页中,验证您已选择要导入 Warehouse Builder 的所有对象。您可以编辑对象的描述字段。 单击 Advanced Import Options 检查各个导入选项,如屏幕截图所示。 单击 OK。单击 Finish。在 Import Results 页中,单击 OK。 您现在已经完成了 Oracle 数据库定义的导入。 在 Oracle Warehouse Builder 客户端中,检查导入的元数据。展开 HR 模块并检查为表导入的元数据。 |
总结
在本教程中,您学习了如何:
创建平面文件源模块。文件模块定义了与包含一些平面文件示例的文件夹的连接。 | ||
为创建平面文件的定义,使用了: | ||
Import Metadata Wizard 来导入平面文件 | ||
Flat File Sample Wizard 来对平面文件进行抽样 | ||
简要检查 Oracle 数据库模块 |
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/1384/viewspace-219066/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/1384/viewspace-219066/